วิทยาศาสตร์ข้อมูล- ข้อมูลเบื้องต้นเกี่ยวกับสถิติ
ข้อมูลเบื้องต้นเกี่ยวกับสถิติ
สถิติเป็นศาสตร์แห่งการวิเคราะห์ข้อมูล
เมื่อเราสร้างแบบจำลองสำหรับการทำนาย เราต้องประเมินความน่าเชื่อถือของการทำนาย
ท้ายที่สุดแล้วการทำนายจะคุ้มค่าอะไรหากเราไม่สามารถพึ่งพามันได้?
สถิติเชิงพรรณนา
ก่อนอื่นเราจะกล่าวถึงสถิติเชิงพรรณนาพื้นฐานบางส่วน
สถิติเชิงพรรณนาสรุปคุณลักษณะที่สำคัญของชุดข้อมูล เช่น
- นับ
- ซำ
- ส่วนเบี่ยงเบนมาตรฐาน
- เปอร์เซ็นไทล์
- เฉลี่ย
- ฯลฯ..
เป็นจุดเริ่มต้นที่ดีในการทำความคุ้นเคยกับข้อมูล
เราสามารถใช้describe()
ฟังก์ชันใน Python เพื่อสรุปข้อมูลได้:
ตัวอย่าง
print (full_health_data.describe())
เอาท์พุท:
คุณเห็นสิ่งที่น่าสนใจที่นี่หรือไม่?