วิทยาศาสตร์ข้อมูล- เปอร์เซ็นไทล์สถิติ


25%, 50% และ 75% - เปอร์เซ็นไทล์

เปอร์เซ็นไทล์ใช้ในสถิติเพื่อให้คุณได้ตัวเลขที่อธิบายค่าที่เปอร์เซ็นต์ที่กำหนดของค่านั้นต่ำกว่า

เปอร์เซ็นไทล์

ให้เราลองอธิบายด้วยตัวอย่างโดยใช้ Average_Pulse

  • เปอร์เซ็นต์ไทล์ 25% ของ Average_Pulse หมายความว่า 25% ของเซสชันการฝึกทั้งหมดมีชีพจรเฉลี่ย 100 ครั้งต่อนาทีหรือต่ำกว่า หากเราพลิกข้อความ แสดงว่า 75% ของเซสชันการฝึกทั้งหมดมีชีพจรเฉลี่ย 100 ครั้งต่อนาทีหรือสูงกว่า
  • เปอร์เซ็นต์ไทล์ 75% ของ Average_Pulse หมายความว่า 75% ของเซสชันการฝึกทั้งหมดมีชีพจรเฉลี่ย 111 หรือต่ำกว่า หากเราพลิกข้อความ แสดงว่า 25% ของการฝึกทั้งหมดมีชีพจรเฉลี่ย 111 ครั้งต่อนาทีหรือสูงกว่า

งาน: ค้นหาเปอร์เซ็นไทล์ 10% สำหรับ Max_Pulse

ตัวอย่างต่อไปนี้แสดงวิธีการทำใน Python:

ตัวอย่าง

import numpy as np

Max_Pulse= full_health_data["Max_Pulse"]
percentile10 = np.percentile(Max_Pulse, 10)
print(percentile10)
  • Max_Pulse = full_health_data["Max_Pulse"] - แยกตัวแปร Max_Pulse ออกจากชุดข้อมูลสุขภาพทั้งหมด
  • np.percentile() ใช้เพื่อกำหนดว่าเราต้องการ 10% เปอร์เซ็นไทล์จาก Max_Pulse

เปอร์เซ็นไทล์ 10% ของ Max_Pulse คือ 120 ซึ่งหมายความว่า 10% ของเซสชันการฝึกทั้งหมดมี Max_Pulse 120 หรือต่ำกว่า