วิทยาศาสตร์ข้อมูล- ข้อมูลเบื้องต้นเกี่ยวกับสถิติ


ข้อมูลเบื้องต้นเกี่ยวกับสถิติ

สถิติเป็นศาสตร์แห่งการวิเคราะห์ข้อมูล

เมื่อเราสร้างแบบจำลองสำหรับการทำนาย เราต้องประเมินความน่าเชื่อถือของการทำนาย

ท้ายที่สุดแล้วการทำนายจะคุ้มค่าอะไรหากเราไม่สามารถพึ่งพามันได้?


สถิติเชิงพรรณนา

ก่อนอื่นเราจะกล่าวถึงสถิติเชิงพรรณนาพื้นฐานบางส่วน

สถิติเชิงพรรณนาสรุปคุณลักษณะที่สำคัญของชุดข้อมูล เช่น

  • นับ
  • ซำ
  • ส่วนเบี่ยงเบนมาตรฐาน
  • เปอร์เซ็นไทล์
  • เฉลี่ย
  • ฯลฯ..

เป็นจุดเริ่มต้นที่ดีในการทำความคุ้นเคยกับข้อมูล

เราสามารถใช้describe()ฟังก์ชันใน Python เพื่อสรุปข้อมูลได้:

ตัวอย่าง

print (full_health_data.describe())

เอาท์พุท:

สถิติอธิบาย

คุณเห็นสิ่งที่น่าสนใจที่นี่หรือไม่?