วิทยาศาสตร์ข้อมูล- พล็อตฟังก์ชันเชิงเส้น
ชุดข้อมูลนาฬิกาสปอร์ต
ดูชุดข้อมูลสุขภาพของเรา:
ระยะเวลา | ค่าเฉลี่ย_Pulse | Max_Pulse | แคลอรี่_เบิร์น | ชั่วโมง_ทำงาน | Hours_Sleep |
---|---|---|---|---|---|
30 | 80 | 120 | 240 | 10 | 7 |
30 | 85 | 120 | 250 | 10 | 7 |
45 | 90 | 130 | 260 | 8 | 7 |
45 | 95 | 130 | 270 | 8 | 7 |
45 | 100 | 140 | 280 | 0 | 7 |
60 | 105 | 140 | 290 | 7 | 8 |
60 | 110 | 145 | 300 | 7 | 8 |
60 | 115 | 145 | 310 | 8 | 8 |
75 | 120 | 150 | 320 | 0 | 8 |
75 | 125 | 150 | 330 | 8 | 8 |
พล็อตข้อมูลที่มีอยู่ใน Python
ตอนนี้ อันดับแรก เราสามารถพล็อตค่าของ Average_Pulse เทียบกับ Calorie_Burnage โดยใช้ไลบรารี matplotlib
ฟังก์ชันplot()
นี้ใช้เพื่อสร้างพล็อต binning หกเหลี่ยม 2 มิติของจุด x,y:
ตัวอย่าง
import matplotlib.pyplot as plt
health_data.plot(x ='Average_Pulse',
y='Calorie_Burnage', kind='line'),
plt.ylim(ymin=0)
plt.xlim(xmin=0)
plt.show()
ตัวอย่างที่อธิบาย
- นำเข้าโมดูล pyplot ของไลบรารี matplotlib
- พล็อตข้อมูลจาก Average_Pulse เทียบกับ Calorie_Burnage
kind='line'
บอกเราว่าเราต้องการพล็อตประเภทใด ตรงนี้เราต้องการเส้นตรง- plt.ylim() และ plt.xlim() บอกเราว่าเราต้องการให้แกนเริ่มต้นที่ค่าใด ที่นี่เราต้องการให้แกนเริ่มจากศูนย์
- plt.show() แสดงผลลัพธ์ให้เราเห็น
รหัสด้านบนจะให้ผลลัพธ์ดังต่อไปนี้:
ผลลัพธ์ของกราฟ
อย่างที่เราเห็น มีความสัมพันธ์ระหว่าง Average_Pulse และ Calorie_Burnage Calorie_Burnage เพิ่มขึ้นตามสัดส่วนด้วย Average_Pulse หมายความว่าเราสามารถใช้ Average_Pulse เพื่อทำนาย Calorie_Burnage
ทำไมเส้นไม่ลากลงไปที่แกน y ทั้งหมด
เหตุผลก็คือเราไม่มีข้อสังเกตว่า Average_Pulse หรือ Calorie_Burnage มีค่าเท่ากับศูนย์ 80 เป็นการสังเกตครั้งแรกของ Average_Pulse และ 240 เป็นการสังเกตครั้งแรกของ Calorie_Burnage
ดูเส้น. จะเกิดอะไรขึ้นกับการเผาผลาญแคลอรี่หากชีพจรเฉลี่ยเพิ่มขึ้นจาก 80 เป็น 90?
เราสามารถใช้เส้นทแยงมุมเพื่อค้นหาฟังก์ชันทางคณิตศาสตร์เพื่อทำนายการเผาผลาญแคลอรี
ตามที่ปรากฎ:
- หากชีพจรเฉลี่ย 80 การเผาผลาญแคลอรี่คือ 240
- หากชีพจรเฉลี่ยอยู่ที่ 90 การเผาผลาญแคลอรี่จะเท่ากับ 260
- หากชีพจรเฉลี่ย 100 การเผาผลาญแคลอรี่จะเท่ากับ 280
มีแบบ. หากชีพจรเฉลี่ยเพิ่มขึ้น 10 การเผาผลาญแคลอรี่จะเพิ่มขึ้น 20