การกระจายข้อมูลแบบสุ่ม
การกระจายข้อมูลคืออะไร?
การกระจายข้อมูลเป็นรายการของค่าที่เป็นไปได้ทั้งหมด และความถี่ที่แต่ละค่าเกิดขึ้น
รายการดังกล่าวมีความสำคัญเมื่อทำงานกับสถิติและวิทยาศาสตร์ข้อมูล
วิธีการเสนอโมดูลแบบสุ่มที่ส่งคืนการกระจายข้อมูลที่สร้างแบบสุ่ม
สุ่มแจก
การแจกแจงแบบสุ่มคือชุดของตัวเลขสุ่มที่เป็นไปตามฟังก์ชันความหนาแน่นของความน่าจะเป็น
ฟังก์ชันความหนาแน่นของความน่าจะเป็น: ฟังก์ชันที่อธิบายความน่าจะเป็นแบบต่อเนื่อง คือ ความน่าจะเป็นของค่าทั้งหมดในอาร์เรย์
เราสามารถสร้างตัวเลขสุ่มตามความน่าจะเป็นที่กำหนดโดยใช้
choice()
วิธีการของ
random
โมดูล
วิธีchoice()
นี้ช่วยให้เราระบุความน่าจะเป็นของแต่ละค่าได้
ความน่าจะเป็นถูกกำหนดโดยตัวเลขระหว่าง 0 ถึง 1 โดยที่ 0 หมายความว่าค่าจะไม่เกิดขึ้น และ 1 หมายความว่าค่านั้นจะเกิดขึ้นเสมอ
ตัวอย่าง
สร้างอาร์เรย์ 1 มิติที่มี 100 ค่า โดยแต่ละค่าต้องเป็น 3, 5, 7 หรือ 9
ความน่าจะเป็นสำหรับค่าที่จะเป็น 3 ถูกกำหนดเป็น0.1
ความน่าจะเป็นสำหรับค่าที่จะเป็น 5 ถูกกำหนดเป็น0.3
ความน่าจะเป็นสำหรับค่าที่จะเป็น 7 ถูกกำหนดเป็น 0.6
ความน่าจะเป็นสำหรับค่าที่จะเป็น 9 ถูกกำหนดเป็น0
from numpy import random
x = random.choice([3, 5, 7, 9], p=[0.1, 0.3,
0.6, 0.0], size=(100))
print(x)
ผลรวมของตัวเลขความน่าจะเป็นทั้งหมดควรเป็น 1
แม้ว่าคุณจะเรียกใช้ตัวอย่างที่สูงกว่า 100 ครั้ง ค่า 9 จะไม่เกิดขึ้น
คุณสามารถส่งคืนอาร์เรย์ที่มีรูปร่างและขนาดใดก็ได้โดยระบุรูปร่างใน
size
พารามิเตอร์
ตัวอย่าง
ตัวอย่างเดียวกับด้านบน แต่ส่งคืนอาร์เรย์ 2 มิติที่มี 3 แถว โดยแต่ละรายการมีค่า 5 ค่า
from numpy import random
x = random.choice([3, 5, 7, 9], p=[0.1, 0.3,
0.6, 0.0], size=(3, 5))
print(x)