การเรียนรู้ของเครื่อง - ส่วนเบี่ยงเบนมาตรฐาน
ค่าเบี่ยงเบนมาตรฐานคืออะไร?
ส่วนเบี่ยงเบนมาตรฐานคือตัวเลขที่อธิบายว่าค่ากระจายออกไปอย่างไร
ค่าเบี่ยงเบนมาตรฐานต่ำหมายความว่าตัวเลขส่วนใหญ่อยู่ใกล้กับค่าเฉลี่ย (ค่าเฉลี่ย)
ค่าเบี่ยงเบนมาตรฐานที่สูงหมายความว่าค่าต่างๆ จะกระจายออกไปในขอบเขตที่กว้างกว่า
ตัวอย่าง: ครั้งนี้เราจดทะเบียนความเร็ว 7 คัน:
speed = [86,87,88,86,87,85,86]
ส่วนเบี่ยงเบนมาตรฐานคือ:
0.9
หมายความว่าค่าส่วนใหญ่อยู่ในช่วง 0.9 จากค่าเฉลี่ยซึ่งก็คือ 86.4
ให้เราทำเช่นเดียวกันกับการเลือกตัวเลขที่มีช่วงกว้างกว่า:
speed = [32,111,138,28,59,77,97]
ส่วนเบี่ยงเบนมาตรฐานคือ:
37.85
หมายความว่าค่าส่วนใหญ่อยู่ในช่วง 37.85 จากค่าเฉลี่ย ซึ่งก็คือ 77.4
อย่างที่คุณเห็น ค่าเบี่ยงเบนมาตรฐานที่สูงขึ้นบ่งชี้ว่าค่าต่างๆ ถูกกระจายออกไปในขอบเขตที่กว้างกว่า
โมดูล NumPy มีวิธีคำนวณค่าเบี่ยงเบนมาตรฐาน:
ตัวอย่าง
ใช้วิธี NumPy std()
เพื่อค้นหาค่าเบี่ยงเบนมาตรฐาน:
import numpy
speed = [86,87,88,86,87,85,86]
x = numpy.std(speed)
print(x)
ตัวอย่าง
import numpy
speed = [32,111,138,28,59,77,97]
x = numpy.std(speed)
print(x)
ความแปรปรวน
ความแปรปรวนเป็นอีกตัวเลขหนึ่งที่บ่งชี้ว่าค่ากระจายออกไปอย่างไร
ที่จริงแล้ว หากคุณหาสแควร์รูทของความแปรปรวน คุณจะได้ค่าเบี่ยงเบนมาตรฐาน!
หรือในทางกลับกัน ถ้าคุณคูณค่าเบี่ยงเบนมาตรฐานด้วยตัวมันเอง คุณจะได้ความแปรปรวน!
ในการคำนวณความแปรปรวนคุณต้องทำดังนี้:
1. ค้นหาค่าเฉลี่ย:
(32+111+138+28+59+77+97) / 7 = 77.4
2. สำหรับแต่ละค่า: ค้นหาความแตกต่างจากค่าเฉลี่ย:
32 - 77.4 = -45.4
111 - 77.4 = 33.6
138
- 77.4 = 60.6
28 - 77.4 = -49.4
59 - 77.4 = -18.4
77
- 77.4 = - 0.4
97 - 77.4 = 19.6
3. สำหรับแต่ละความแตกต่าง: ค้นหาค่ากำลังสอง:
(-45.4)2 = 2061.16
(33.6)2 = 1128.96
(60.6)2 = 3672.36
(-49.4)2 = 2440.36
(-18.4)2 = 338.56
(- 0.4)2 = 0.16
(19.6)2 = 384.16
4. ความแปรปรวนคือจำนวนเฉลี่ยของผลต่างกำลังสองเหล่านี้:
(2061.16+1128.96+3672.36+2440.36+338.56+0.16+384.16)
/ 7 = 1432.2
โชคดีที่ NumPy มีวิธีคำนวณความแปรปรวน:
ตัวอย่าง
ใช้วิธี NumPy var()
เพื่อค้นหาความแปรปรวน:
import numpy
speed = [32,111,138,28,59,77,97]
x = numpy.var(speed)
print(x)
ส่วนเบี่ยงเบนมาตรฐาน
ดังที่เราได้เรียนรู้ไปแล้ว สูตรในการหาค่าเบี่ยงเบนมาตรฐานคือรากที่สองของความแปรปรวน:
√1432.25 = 37.85
หรือในตัวอย่างก่อนหน้านี้ ใช้ NumPy เพื่อคำนวณค่าเบี่ยงเบนมาตรฐาน:
ตัวอย่าง
ใช้วิธี NumPy std()
เพื่อค้นหาค่าเบี่ยงเบนมาตรฐาน:
import numpy
speed = [32,111,138,28,59,77,97]
x = numpy.std(speed)
print(x)
สัญลักษณ์
ค่าเบี่ยงเบนมาตรฐานมักใช้สัญลักษณ์ Sigma: σ
ความแปรปรวนมักแสดงด้วยสัญลักษณ์ Sigma Square: σ 2
สรุปบท
ค่าเบี่ยงเบนมาตรฐานและความแปรปรวนเป็นคำศัพท์ที่มักใช้ในการเรียนรู้ของเครื่อง ดังนั้นจึงเป็นสิ่งสำคัญที่จะต้องเข้าใจวิธีรับค่าเหล่านี้และแนวคิดเบื้องหลัง