การเรียนรู้ของเครื่อง
แมชชีนเลิร์นนิงทำให้คอมพิวเตอร์เรียนรู้จากการศึกษาข้อมูลและสถิติ
การเรียนรู้ของเครื่องเป็นก้าวไปสู่ทิศทางของปัญญาประดิษฐ์ (AI)
Machine Learning เป็นโปรแกรมที่วิเคราะห์ข้อมูลและเรียนรู้ที่จะทำนายผลลัพธ์
ที่จะเริ่มต้น?
ในบทช่วยสอนนี้ เราจะกลับไปที่วิชาคณิตศาสตร์และสถิติการศึกษา และวิธีการคำนวณตัวเลขที่สำคัญตามชุดข้อมูล
นอกจากนี้เรายังจะได้เรียนรู้วิธีการใช้โมดูล Python ต่างๆ เพื่อให้ได้คำตอบที่เราต้องการ
และเราจะเรียนรู้วิธีการสร้างฟังก์ชันที่สามารถทำนายผลลัพธ์ตามสิ่งที่เราได้เรียนรู้
ชุดข้อมูล
ในความคิดของคอมพิวเตอร์ ชุดข้อมูลคือชุดของข้อมูลใดๆ มันสามารถเป็นอะไรก็ได้ตั้งแต่อาร์เรย์ไปจนถึงฐานข้อมูลที่สมบูรณ์
ตัวอย่างของอาร์เรย์:
[99,86,87,88,111,86,103,87,94,78,77,85,86]
ตัวอย่างของฐานข้อมูล:
คาร์เนม | สี | อายุ | ความเร็ว | ออโต้พาส |
BMW | สีแดง | 5 | 99 | Y |
วอลโว่ | สีดำ | 7 | 86 | Y |
VW | สีเทา | 8 | 87 | นู๋ |
VW | สีขาว | 7 | 88 | Y |
ฟอร์ด | สีขาว | 2 | 111 | Y |
VW | สีขาว | 17 | 86 | Y |
เทสลา | สีแดง | 2 | 103 | Y |
BMW | สีดำ | 9 | 87 | Y |
วอลโว่ | สีเทา | 4 | 94 | นู๋ |
ฟอร์ด | สีขาว | 11 | 78 | นู๋ |
โตโยต้า | สีเทา | 12 | 77 | นู๋ |
VW | สีขาว | 9 | 85 | นู๋ |
โตโยต้า | สีฟ้า | 6 | 86 | Y |
เมื่อดูที่อาร์เรย์ เราสามารถเดาได้ว่าค่าเฉลี่ยน่าจะประมาณ 80 หรือ 90 และเราสามารถกำหนดค่าสูงสุดและค่าต่ำสุดได้ แต่เราจะทำอะไรได้อีก
และเมื่อดูจากฐานข้อมูล เราจะเห็นได้ว่าสีที่ได้รับความนิยมมากที่สุดคือสีขาว และรถที่เก่าแก่ที่สุดคือ 17 ปี แต่ถ้าเราสามารถคาดเดาได้ว่ารถยนต์มี AutoPass หรือไม่ เพียงแค่ดูจากค่าอื่นๆ
นั่นคือสิ่งที่แมชชีนเลิร์นนิงมีไว้เพื่อ! วิเคราะห์ข้อมูลและทำนายผล!
ในแมชชีนเลิร์นนิงเป็นเรื่องปกติที่จะทำงานกับชุดข้อมูลขนาดใหญ่มาก ในบทช่วยสอนนี้ เราจะพยายามทำให้เข้าใจแนวคิดต่างๆ ของแมชชีนเลิร์นนิงได้ง่ายที่สุดเท่าที่จะเป็นไปได้ และเราจะทำงานกับชุดข้อมูลขนาดเล็กที่เข้าใจง่าย
ประเภทข้อมูล
ในการวิเคราะห์ข้อมูล สิ่งสำคัญคือต้องรู้ว่าเรากำลังจัดการกับข้อมูลประเภทใด
เราสามารถแบ่งประเภทข้อมูลออกเป็นสามประเภทหลัก:
- ตัวเลข
- หมวดหมู่
- ลำดับ
ข้อมูล ตัวเลขเป็นตัวเลข และสามารถแบ่งออกเป็นสองประเภทตัวเลข:
- Discrete Data
- ตัวเลขที่จำกัดเฉพาะจำนวนเต็ม ตัวอย่าง: จำนวนรถที่วิ่งผ่าน - ข้อมูลต่อเนื่อง
- ตัวเลขที่มีค่าอนันต์ ตัวอย่าง: ราคาของสินค้า หรือขนาดของสินค้า
ข้อมูลตาม หมวดหมู่คือค่าที่ไม่สามารถวัดกันได้ ตัวอย่าง: ค่าสี หรือค่าใช่/ไม่ใช่ใดๆ
ข้อมูล ลำดับเป็นเหมือนข้อมูลที่เป็นหมวดหมู่ แต่สามารถวัดผลซึ่งกันและกันได้ ตัวอย่าง: เกรดของโรงเรียนที่ A ดีกว่า B เป็นต้น
เมื่อทราบชนิดข้อมูลของแหล่งข้อมูลแล้ว คุณจะสามารถทราบได้ว่าจะใช้เทคนิคใดในการวิเคราะห์
คุณจะได้เรียนรู้เพิ่มเติมเกี่ยวกับสถิติและการวิเคราะห์ข้อมูลในบทต่อไป