วิทยาศาสตร์ข้อมูล- พล็อตฟังก์ชันเชิงเส้น


ชุดข้อมูลนาฬิกาสปอร์ต

ดูชุดข้อมูลสุขภาพของเรา:

ระยะเวลา ค่าเฉลี่ย_Pulse Max_Pulse แคลอรี่_เบิร์น ชั่วโมง_ทำงาน Hours_Sleep
30 80 120 240 10 7
30 85 120 250 10 7
45 90 130 260 8 7
45 95 130 270 8 7
45 100 140 280 0 7
60 105 140 290 7 8
60 110 145 300 7 8
60 115 145 310 8 8
75 120 150 320 0 8
75 125 150 330 8 8

พล็อตข้อมูลที่มีอยู่ใน Python

ตอนนี้ อันดับแรก เราสามารถพล็อตค่าของ Average_Pulse เทียบกับ Calorie_Burnage โดยใช้ไลบรารี matplotlib

ฟังก์ชันplot()นี้ใช้เพื่อสร้างพล็อต binning หกเหลี่ยม 2 มิติของจุด x,y:

ตัวอย่าง

import matplotlib.pyplot as plt

health_data.plot(x ='Average_Pulse', y='Calorie_Burnage', kind='line'),
plt.ylim(ymin=0)
plt.xlim(xmin=0)

plt.show()

ตัวอย่างที่อธิบาย

  • นำเข้าโมดูล pyplot ของไลบรารี matplotlib
  • พล็อตข้อมูลจาก Average_Pulse เทียบกับ Calorie_Burnage
  • kind='line'บอกเราว่าเราต้องการพล็อตประเภทใด ตรงนี้เราต้องการเส้นตรง
  • plt.ylim() และ plt.xlim() บอกเราว่าเราต้องการให้แกนเริ่มต้นที่ค่าใด ที่นี่เราต้องการให้แกนเริ่มจากศูนย์
  • plt.show() แสดงผลลัพธ์ให้เราเห็น

รหัสด้านบนจะให้ผลลัพธ์ดังต่อไปนี้:

ฟังก์ชันเชิงเส้น

ผลลัพธ์ของกราฟ

อย่างที่เราเห็น มีความสัมพันธ์ระหว่าง Average_Pulse และ Calorie_Burnage Calorie_Burnage เพิ่มขึ้นตามสัดส่วนด้วย Average_Pulse หมายความว่าเราสามารถใช้ Average_Pulse เพื่อทำนาย Calorie_Burnage



ทำไมเส้นไม่ลากลงไปที่แกน y ทั้งหมด

เหตุผลก็คือเราไม่มีข้อสังเกตว่า Average_Pulse หรือ Calorie_Burnage มีค่าเท่ากับศูนย์ 80 เป็นการสังเกตครั้งแรกของ Average_Pulse และ 240 เป็นการสังเกตครั้งแรกของ Calorie_Burnage

ฟังก์ชันเชิงเส้น

ดูเส้น. จะเกิดอะไรขึ้นกับการเผาผลาญแคลอรี่หากชีพจรเฉลี่ยเพิ่มขึ้นจาก 80 เป็น 90?

ฟังก์ชันเชิงเส้น

เราสามารถใช้เส้นทแยงมุมเพื่อค้นหาฟังก์ชันทางคณิตศาสตร์เพื่อทำนายการเผาผลาญแคลอรี

ตามที่ปรากฎ:

  • หากชีพจรเฉลี่ย 80 การเผาผลาญแคลอรี่คือ 240
  • หากชีพจรเฉลี่ยอยู่ที่ 90 การเผาผลาญแคลอรี่จะเท่ากับ 260
  • หากชีพจรเฉลี่ย 100 การเผาผลาญแคลอรี่จะเท่ากับ 280

มีแบบ. หากชีพจรเฉลี่ยเพิ่มขึ้น 10 การเผาผลาญแคลอรี่จะเพิ่มขึ้น 20