การกระจายข้อมูลแบบสุ่ม

การกระจายข้อมูลคืออะไร?

การกระจายข้อมูลเป็นรายการของค่าที่เป็นไปได้ทั้งหมด และความถี่ที่แต่ละค่าเกิดขึ้น

รายการดังกล่าวมีความสำคัญเมื่อทำงานกับสถิติและวิทยาศาสตร์ข้อมูล

วิธีการเสนอโมดูลแบบสุ่มที่ส่งคืนการกระจายข้อมูลที่สร้างแบบสุ่ม

การแจกแจงแบบสุ่มคือชุดของตัวเลขสุ่มที่เป็นไปตามฟังก์ชันความหนาแน่นของความน่าจะเป็น

ฟังก์ชันความหนาแน่นของความน่าจะเป็น: ฟังก์ชันที่อธิบายความน่าจะเป็นแบบต่อเนื่อง คือ ความน่าจะเป็นของค่าทั้งหมดในอาร์เรย์

เราสามารถสร้างตัวเลขสุ่มตามความน่าจะเป็นที่กำหนดโดยใช้ choice()วิธีการของ randomโมดูล

วิธีchoice()นี้ช่วยให้เราระบุความน่าจะเป็นของแต่ละค่าได้

ความน่าจะเป็นถูกกำหนดโดยตัวเลขระหว่าง 0 ถึง 1 โดยที่ 0 หมายความว่าค่าจะไม่เกิดขึ้น และ 1 หมายความว่าค่านั้นจะเกิดขึ้นเสมอ

สร้างอาร์เรย์ 1 มิติที่มี 100 ค่า โดยแต่ละค่าต้องเป็น 3, 5, 7 หรือ 9

ความน่าจะเป็นสำหรับค่าที่จะเป็น 3 ถูกกำหนดเป็น0.1

ความน่าจะเป็นสำหรับค่าที่จะเป็น 5 ถูกกำหนดเป็น0.3

ความน่าจะเป็นสำหรับค่าที่จะเป็น 7 ถูกกำหนดเป็น 0.6

ความน่าจะเป็นสำหรับค่าที่จะเป็น 9 ถูกกำหนดเป็น0

from numpy import random

x = random.choice([3, 5, 7, 9], p=[0.1, 0.3, 0.6, 0.0], size=(100))

print(x)

ผลรวมของตัวเลขความน่าจะเป็นทั้งหมดควรเป็น 1

แม้ว่าคุณจะเรียกใช้ตัวอย่างที่สูงกว่า 100 ครั้ง ค่า 9 จะไม่เกิดขึ้น

คุณสามารถส่งคืนอาร์เรย์ที่มีรูปร่างและขนาดใดก็ได้โดยระบุรูปร่างใน sizeพารามิเตอร์

ตัวอย่างเดียวกับด้านบน แต่ส่งคืนอาร์เรย์ 2 มิติที่มี 3 แถว โดยแต่ละรายการมีค่า 5 ค่า

from numpy import random

x = random.choice([3, 5, 7, 9], p=[0.1, 0.3, 0.6, 0.0], size=(3, 5))

print(x)