ฟังก์ชันวิทยาศาสตร์ข้อมูล


บทนี้แสดงสามฟังก์ชันที่ใช้โดยทั่วไปเมื่อทำงานกับ Data Science: max(), min() และ mean()


ชุดข้อมูลนาฬิกาสปอร์ต

ระยะเวลา ค่าเฉลี่ย_Pulse Max_Pulse แคลอรี่_เบิร์น ชั่วโมง_ทำงาน Hours_Sleep
30 80 120 240 10 7
30 85 120 250 10 7
45 90 130 260 8 7
45 95 130 270 8 7
45 100 140 280 0 7
60 105 140 290 7 8
60 110 145 300 7 8
60 115 145 310 8 8
75 120 150 320 0 8
75 125 150 330 8 8

ชุดข้อมูลข้างต้นประกอบด้วยตัวแปร 6 ตัว โดยแต่ละตัวมีการสังเกต 10 ตัว:

  • Duration - เซสชั่นการฝึกอบรมใช้เวลานานเท่าใดในหน่วยนาที?
  • Average_Pulse - ชีพจรเฉลี่ยของเซสชั่นการฝึกอบรมคืออะไร? ซึ่งวัดจากการเต้นต่อนาที
  • Max_Pulse - ชีพจรสูงสุดของเซสชันการฝึกอบรมคืออะไร?
  • Calorie_Burnage - จำนวนแคลอรีที่ถูกเผาผลาญในการฝึกซ้อม?
  • Hours_Work - เราทำงานที่งานก่อนการฝึกอบรมกี่ชั่วโมง?
  • Hours_Sleep - คืนก่อนการฝึกเรานอนเท่าไหร่?

เราใช้ขีดล่าง (_) เพื่อแยกสตริงเนื่องจาก Python ไม่สามารถอ่านช่องว่างเป็นตัวคั่นได้



ฟังก์ชัน max()

ฟังก์ชัน Python max()ใช้สำหรับค้นหาค่าสูงสุดในอาร์เรย์

ตัวอย่าง

Average_pulse_max = max(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)

print (Average_pulse_max)

ฟังก์ชัน min()

ฟังก์ชัน Python min()ใช้สำหรับค้นหาค่าต่ำสุดในอาร์เรย์

ตัวอย่าง

Average_pulse_min = min(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)

print (Average_pulse_min)

ฟังก์ชัน Mean()

ฟังก์ชัน NumPy mean()ใช้เพื่อค้นหาค่าเฉลี่ยของอาร์เรย์

ตัวอย่าง

import numpy as np

Calorie_burnage = [240, 250, 260, 270, 280, 290, 300, 310, 320, 330]

Average_calorie_burnage = np.mean(Calorie_burnage)

print(Average_calorie_burnage)

เราเขียนnp ข้างหน้าของmeanเพื่อให้ Python รู้ว่าเราต้องการเปิดใช้งานฟังก์ชันmean จาก ไลบรารีNumpy