หมีแพนด้า - พล็อต
พล็อต
นุ่นใช้plot()
วิธีนี้เพื่อสร้างไดอะแกรม
เราสามารถใช้ Pyplot ซึ่งเป็นโมดูลย่อยของไลบรารี Matplotlib เพื่อแสดงภาพไดอะแกรมบนหน้าจอ
อ่านเพิ่มเติมเกี่ยวกับ Matplotlib ในการสอน Matplotlibของ เรา
ตัวอย่าง
นำเข้า pyplot จาก Matplotlib และเห็นภาพ DataFrame ของเรา:
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('data.csv')
df.plot()
plt.show()
ตัวอย่างในหน้านี้ใช้ไฟล์ CSV ชื่อ: 'data.csv'
ดาวน์โหลด data.csvหรือOpen data.csv
พล็อตกระจาย
ระบุว่าคุณต้องการพล็อตแบบกระจายด้วย
kind
อาร์กิวเมนต์:
kind = 'scatter'
พล็อตกระจายต้องการแกน x และ y
ในตัวอย่างด้านล่าง เราจะใช้ "ระยะเวลา" สำหรับแกน x และ "แคลอรี่" สำหรับแกน y
รวมอาร์กิวเมนต์ x และ y ดังนี้:
x = 'Duration', y = 'Calories'
ตัวอย่าง
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('data.csv')
df.plot(kind = 'scatter', x = 'Duration', y = 'Calories')
plt.show()
ผลลัพธ์
ข้อควร จำ:
ในตัวอย่างก่อนหน้านี้ เราได้เรียนรู้ว่าความสัมพันธ์ระหว่าง "ระยะเวลา" กับ "แคลอรี่" คือ0.922721
และเราสรุปได้ว่าระยะเวลาที่สูงขึ้นหมายถึงการเผาผลาญแคลอรีมากขึ้น
โดยดูที่ scatterplot ฉันจะเห็นด้วย
มาสร้าง scatterplot อื่นซึ่งมีความสัมพันธ์ที่ไม่ดีระหว่างคอลัมน์ เช่น "Duration" และ "Maxpulse" โดยมีความสัมพันธ์0.009403
กัน:
ตัวอย่าง
scatterplot ที่ไม่มีความสัมพันธ์ระหว่างคอลัมน์:
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('data.csv')
df.plot(kind = 'scatter', x = 'Duration', y = 'Maxpulse')
plt.show()
ผลลัพธ์
ได้รับการรับรอง!
$10 ลงทะเบียน
ฮิสโตแกรม
ใช้
kind
อาร์กิวเมนต์เพื่อระบุว่าคุณต้องการฮิสโตแกรม:
kind = 'hist'
ฮิสโตแกรมต้องการเพียงคอลัมน์เดียว
ฮิสโตแกรมแสดงให้เราเห็นความถี่ของแต่ละช่วงเวลา เช่น กี่การออกกำลังกายที่กินเวลาระหว่าง 50 ถึง 60 นาที?
ในตัวอย่างด้านล่าง เราจะใช้คอลัมน์ "ระยะเวลา" เพื่อสร้างฮิสโตแกรม:
ตัวอย่าง
df["Duration"].plot(kind = 'hist')
ผลลัพธ์
หมายเหตุ: ฮิสโตแกรมบอกเราว่ามีการออกกำลังกายมากกว่า 100 ครั้งซึ่งกินเวลาระหว่าง 50-60 นาที