พล็อตกระจาย R


พล็อตกระจาย

คุณได้เรียนรู้จากบทพล็อตว่าplot()ฟังก์ชันนี้ใช้ในการพล็อตตัวเลขต่อกัน

"โครงแบบกระจาย" เป็นแผนผังประเภทหนึ่งที่ใช้แสดงความสัมพันธ์ระหว่างตัวแปรตัวเลขสองตัว และพล็อตจุดหนึ่งจุดสำหรับการสังเกตแต่ละครั้ง

มันต้องการเวกเตอร์สองตัวที่มีความยาวเท่ากัน อันหนึ่งสำหรับแกน x (แนวนอน) และอีกอันสำหรับแกน y (แนวตั้ง):

ตัวอย่าง

x <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y <- c(99,86,87,88,111,103,87,94,78,77,85,86)

plot(x, y)

ผลลัพธ์:

การสังเกตในตัวอย่างข้างต้นควรแสดงผลรถยนต์ 12 คันที่ผ่านไปมา

นั่นอาจไม่ชัดเจนสำหรับผู้ที่เห็นกราฟเป็นครั้งแรก ให้เพิ่มส่วนหัวและป้ายกำกับอื่นเพื่ออธิบายแผนภาพการกระจายให้ดีขึ้น:

ตัวอย่าง

x <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y <- c(99,86,87,88,111,103,87,94,78,77,85,86)

plot(x, y, main="Observation of Cars", xlab="Car age", ylab="Car speed")

ผลลัพธ์:

โดยสรุป การสังเกตในตัวอย่างข้างต้นเป็นผลจากรถยนต์ 12 คันที่ผ่านไปมา

แกนxแสดงอายุรถ

แกนyแสดงความเร็วของรถเมื่อผ่าน

มีความสัมพันธ์ใด ๆ ระหว่างการสังเกตหรือไม่?

ดูเหมือนว่ายิ่งรถใหม่เท่าไหร่ก็ยิ่งขับเร็วขึ้น แต่นั่นอาจเป็นเรื่องบังเอิญ เพราะเราจดทะเบียนรถเพียง 12 คันเท่านั้น



เปรียบเทียบพล็อต

ในตัวอย่างข้างต้น ดูเหมือนว่าจะมีความสัมพันธ์ระหว่างความเร็วของรถกับอายุ แต่ถ้าเราพล็อตข้อสังเกตจากวันอื่นด้วยล่ะ พล็อตกระจายจะบอกอะไรเราอีกไหม

หากต้องการเปรียบเทียบโครงเรื่องกับโครงเรื่องอื่น ให้ใช้points()ฟังก์ชัน:

ตัวอย่าง

วาดสองแปลงในรูปเดียวกัน:

# day one, the age and speed of 12 cars:
x1 <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y1 <- c(99,86,87,88,111,103,87,94,78,77,85,86)

# day two, the age and speed of 15 cars:
x2 <- c(2,2,8,1,15,8,12,9,7,3,11,4,7,14,12)
y2 <- c(100,105,84,105,90,99,90,95,94,100,79,112,91,80,85)

plot(x1, y1, main="Observation of Cars", xlab="Car age", ylab="Car speed", col="red", cex=2)
points(x2, y2, col="blue", cex=2)

ผลลัพธ์:

หมายเหตุ:หากต้องการดูความแตกต่างของการเปรียบเทียบ คุณต้องกำหนดสีต่างๆ ให้กับแปลง (โดยใช้colพารามิเตอร์) สีแดงหมายถึงค่าของวันที่ 1 ในขณะที่สีน้ำเงินหมายถึงวันที่ 2 โปรดทราบว่าเราได้เพิ่มcexพารามิเตอร์เพื่อเพิ่มขนาดของจุดด้วย

ข้อสรุปจากการสังเกต:เมื่อเปรียบเทียบทั้งสองแปลงแล้ว ผมคิดว่าน่าจะปลอดภัยที่จะบอกว่าทั้งสองให้ข้อสรุปแบบเดียวกันคือ ยิ่งรถใหม่เท่าไรก็ยิ่งขับเร็วขึ้นเท่านั้น