การกระจาย Zipf
การแจกจ่าย Zipf ใช้เพื่อสุ่มตัวอย่างข้อมูลตามกฎหมายของ zipf
กฎของ Zipf: ในคอลเลกชั่น เทอมทั่วไปที่ n คือ 1/n คูณของเทอมทั่วไป เช่น คำทั่วไปที่ 5 ในภาษาอังกฤษเกิดขึ้นเกือบ 1/5 ครั้งของคำที่ใช้บ่อยที่สุด
มันมีสองพารามิเตอร์:
a
- พารามิเตอร์การกระจาย
size
- รูปร่างของอาร์เรย์ที่ส่งคืน
ตัวอย่าง
วาดตัวอย่างสำหรับการกระจาย zipf ด้วยพารามิเตอร์การกระจาย 2 ที่มีขนาด 2x3:
from numpy import random
x = random.zipf(a=2, size=(2, 3))
print(x)
การแสดงภาพการกระจาย Zipf
ตัวอย่าง 1000 จุด แต่พล็อตเฉพาะจุดที่มีค่า < 10 สำหรับแผนภูมิที่มีความหมายมากขึ้น
ตัวอย่าง
from numpy import random
import matplotlib.pyplot as plt
import seaborn as sns
x = random.zipf(a=2, size=1000)
sns.distplot(x[x<10], kde=False)
plt.show()