แมชชีนเลิร์นนิงคืออะไร

แมชชีนเลิร์นนิง (ML) เป็นตัวขับเคลื่อนเทคโนโลยีที่สำคัญที่สุดส่วนหนึ่งที่เราใช้ ตั้งแต่แอปแปลภาษาไปจนถึงยานพาหนะแบบไร้คนขับ หลักสูตรนี้จะอธิบายแนวคิด สำคัญเบื้องหลังแมชชีนเลิร์นนิง

ML นำเสนอวิธีใหม่ในการแก้ปัญหา ตอบคำถามที่ซับซ้อน และสร้างเนื้อหาใหม่ ML สามารถคาดการณ์สภาพอากาศ บอกระยะเวลาเดินทาง แนะนำเพลง เติมประโยคอัตโนมัติ สรุปบทความ และสร้างรูปภาพที่ไม่เคยเห็นมาก่อน

พูดง่ายๆ ก็คือ ML คือกระบวนการการฝึกซอฟต์แวร์ที่เรียกว่าmodelเพื่อสร้างการคาดการณ์ที่เป็นประโยชน์หรือสร้างเนื้อหาจากข้อมูล

ตัวอย่างเช่น สมมติว่าเราต้องการสร้างแอปสำหรับคาดการณ์ปริมาณฝน เราอาจจะใช้แนวทางแบบดั้งเดิมหรือ ML ก็ได้ เราจะสร้างภาพแทนชั้นบรรยากาศและพื้นผิวโลกโดยใช้หลักฟิสิกส์โดยใช้การคำนวณสมการไดนามิกของของเหลวจำนวนมหาศาล เรื่องนี้ เป็นเรื่องที่ยากมาก

เมื่อใช้วิธีการ ML เราจะให้ข้อมูลสภาพอากาศจำนวนมหาศาลแก่โมเดล ML จนกว่าโมเดล ML จะเรียนรู้ความสัมพันธ์ทางคณิตศาสตร์ระหว่างรูปแบบสภาพอากาศที่มีปริมาณน้ำฝนแตกต่างกัน จากนั้นเราจะให้โมเดลข้อมูลสภาพอากาศปัจจุบัน และคาดการณ์ปริมาณฝน

ตรวจสอบความเข้าใจของคุณ

"โมเดล" ในแมชชีนเลิร์นนิงคืออะไร
โมเดลคือความสัมพันธ์ทางคณิตศาสตร์ที่ได้มาจากข้อมูลที่ระบบ ML ใช้ในการคาดการณ์
โมเดลคือชิ้นส่วนของฮาร์ดแวร์คอมพิวเตอร์
โมเดลคือการนำเสนอที่เล็กลงของสิ่งที่คุณกำลังศึกษา

ระบบ ML ประเภทต่างๆ

ระบบ ML จะจัดอยู่ในหมวดหมู่ต่อไปนี้อย่างน้อย 1 หมวดหมู่ตามวิธีการเรียนรู้วิธีการคาดการณ์หรือสร้างเนื้อหา

  • การเรียนรู้ที่มีการควบคุมดูแล
  • การเรียนรู้แบบไม่มีการควบคุมดูแล
  • การเรียนรู้แบบเสริมกำลัง
  • Generative AI

การเรียนรู้ที่มีการควบคุมดูแล

โมเดลการเรียนรู้ที่มีการควบคุมดูแลสามารถคาดคะเนได้หลังจากเห็นข้อมูลจำนวนมากที่มีคำตอบที่ถูกต้อง แล้วค้นพบความเชื่อมโยงระหว่างองค์ประกอบในข้อมูลที่ทำให้เกิดคำตอบที่ถูกต้อง เปรียบได้กับการที่นักเรียนได้เรียนรู้เนื้อหาใหม่โดยการศึกษาข้อสอบเก่าๆ ที่มีทั้งคำถามและคำตอบ เมื่อนักเรียนฝึกฝนเตรียมสอบเก่าๆ มากพอ ก็จะมีความพร้อมในการทำข้อสอบใหม่ ระบบ ML เหล่านี้มีการ "มีการควบคุมดูแล" ในลักษณะที่มนุษย์ให้ข้อมูลระบบ ML พร้อมผลลัพธ์ที่ถูกต้องที่ทราบแล้ว

Use Case ที่พบบ่อยที่สุด 2 รายการสำหรับการเรียนรู้ภายใต้การควบคุมดูแลคือการถดถอยและการแยกประเภท

การถดถอย

โมเดลการถดถอยจะคาดการณ์ค่าตัวเลข เช่น โมเดลสภาพอากาศที่คาดการณ์ปริมาณฝนเป็นนิ้วหรือมิลลิเมตรก็เป็นรูปแบบการถดถอย

ดูตัวอย่างเพิ่มเติมของรูปแบบการถดถอยได้ที่ตารางด้านล่าง

สถานการณ์ ข้อมูลอินพุตที่เป็นไปได้ การคาดการณ์ด้วยตัวเลข
ราคาบ้านในอนาคต พื้นที่ขนาดสี่เหลี่ยมจัตุรัส รหัสไปรษณีย์ จำนวนห้องนอนและห้องน้ำ ขนาดพื้นที่ อัตราดอกเบี้ยสินเชื่อ อัตราภาษีอสังหาริมทรัพย์ ค่าก่อสร้าง และจำนวนบ้านที่ขายในพื้นที่ ราคาบ้าน
เวลาโดยสารในอนาคต สภาพการจราจรที่ผ่านมา (รวบรวมจากสมาร์ทโฟน เซ็นเซอร์ตรวจจับการจราจร บริการเรียกรถโดยสาร และแอปพลิเคชันการนำทางอื่นๆ) ระยะทางจากจุดหมาย และสภาพอากาศ เวลาในหน่วยนาทีและวินาทีที่จะมาถึงจุดหมาย

การจำแนกประเภท

โมเดลการจัดประเภทจะคาดการณ์ แนวโน้มที่เนื้อหาจะอยู่ในหมวดหมู่หนึ่งๆ โมเดลการแยกประเภทจะแสดงค่าที่ระบุว่าเนื้อหาใดอยู่ในหมวดหมู่ใดหมวดหมู่หนึ่งหรือไม่ ซึ่งแตกต่างจากโมเดลการถดถอย เช่น โมเดลการจัดประเภทใช้เพื่อคาดการณ์ว่าอีเมลเป็นสแปมหรือรูปภาพมีแมวหรือไม่

โมเดลการจัดประเภทจะแบ่งออกเป็น 2 กลุ่ม ได้แก่ การจัดประเภทแบบไบนารีและการจัดประเภทแบบหลายคลาส โมเดลการจัดประเภทแบบไบนารีจะแสดงค่าจากคลาสที่มีเพียง 2 ค่า เช่น โมเดลที่มีเอาต์พุตเป็น rain หรือ no rain โมเดลการจัดประเภทแบบหลายคลาสจะแสดงค่าจากคลาสที่มีมากกว่า 2 ค่า เช่น โมเดลที่เอาต์พุตเป็น rain, hail, snow หรือ sleet ได้

ตรวจสอบความเข้าใจของคุณ

หากต้องการใช้โมเดล ML เพื่อคาดการณ์การใช้พลังงานสำหรับอาคารพาณิชย์ คุณจะใช้โมเดลประเภทใด
การถดถอย
การใช้พลังงานจะวัดเป็นหน่วยกิโลวัตต์ชั่วโมง (kWh) ซึ่งเป็นตัวเลข คุณจึงควรใช้รูปแบบการถดถอย
การจำแนกประเภท
โมเดลการแยกประเภทจะคาดการณ์ว่าเนื้อหาหนึ่งๆ อยู่ในหมวดหมู่หรือไม่ ขณะที่โมเดลการถดถอยจะคาดการณ์จำนวน เนื่องจากการใช้พลังงานมีหน่วยวัดเป็นกิโลวัตต์-ชั่วโมง (kWh) ซึ่งเป็นตัวเลข คุณจึงควรใช้รูปแบบการถดถอย

การเรียนรู้แบบไม่มีการควบคุมดูแล

โมเดลการเรียนรู้ที่ไม่มีการควบคุมดูแลทำการคาดคะเนจากข้อมูลที่ไม่มีคำตอบที่ถูกต้อง เป้าหมายของโมเดลการเรียนรู้ที่ไม่มีการควบคุมดูแลคือการระบุรูปแบบที่มีความหมายในข้อมูล กล่าวคือ โมเดลไม่มีคำแนะนำเกี่ยวกับวิธีจัดหมวดหมู่ข้อมูลแต่ละส่วน แต่ต้องอนุมานกฎของตัวเองแทน

โมเดลการเรียนรู้ที่ไม่มีการควบคุมดูแลที่ใช้กันโดยทั่วไปจะใช้เทคนิคที่เรียกว่าคลัสเตอร์ โมเดลจะค้นหาจุดข้อมูล ที่แบ่งส่วนการจัดกลุ่มอย่างเป็นธรรมชาติ

รูปภาพแสดงจุดสีในกลุ่ม

รูปที่ 1 โมเดล ML จัดกลุ่มจุดข้อมูลที่คล้ายกัน

รูปภาพแสดงจุดสีในกลุ่มที่ล้อมด้วยรูปร่างและมีเส้นขอบซึ่งกันและกัน

รูปที่ 2 กลุ่มของคลัสเตอร์ที่มีการปักปันส่วนตามธรรมชาติ

การจัดกลุ่มแตกต่างจากการจัดประเภทเนื่องจากคุณไม่ได้กำหนดหมวดหมู่เอง เช่น โมเดลที่ไม่มีการควบคุมดูแลอาจจัดกลุ่มชุดข้อมูลสภาพอากาศโดยอิงตามอุณหภูมิ ซึ่งจะแสดงการแบ่งกลุ่มที่ระบุฤดูกาล จากนั้นคุณอาจลองตั้งชื่อคลัสเตอร์เหล่านั้นตามความเข้าใจเกี่ยวกับชุดข้อมูลดังกล่าว

รูปภาพแสดงจุดสีเป็นกลุ่มที่มีป้ายกำกับหิมะ ฝน ลูกเห็บ และไม่มีฝนตก

รูปที่ 3 โมเดล ML จัดกลุ่มรูปแบบสภาพอากาศที่คล้ายกัน

รูปภาพแสดงจุดสีในกลุ่มต่างๆ ที่มีป้ายกำกับว่าหิมะ ฝน ลูกเห็บ และฝนที่ตกลงมาล้อมเป็นรูปร่างและมีเส้นขอบซึ่งกันและกัน

รูปที่ 4 กลุ่มรูปแบบสภาพอากาศที่มีป้ายกำกับว่าเป็นหิมะ ฝนลูกเห็บ ฝน และไม่มีฝนตก

ตรวจสอบความเข้าใจของคุณ

วิธีการที่มีการควบคุมดูแลแตกต่างจากวิธีการที่ไม่มีการควบคุมดูแลคืออะไร
แนวทางที่มีการควบคุมดูแลจะได้รับข้อมูลที่มีคำตอบที่ถูกต้อง
แนวทางที่มีการควบคุมดูแลจะได้รับข้อมูลที่มีคำตอบที่ถูกต้อง งานของโมเดลคือการค้นหาการเชื่อมต่อในข้อมูลที่ให้คำตอบที่ถูกต้อง วิธีการที่ไม่มีการควบคุมดูแลจะได้รับข้อมูลโดยไม่มีคำตอบที่ถูกต้อง หน้าที่ของเครื่องมือนี้คือการค้นหาการจัดกลุ่มในข้อมูล
วิธีที่มีการควบคุมดูแลมักจะใช้การจัดกลุ่ม
แนวทางที่ไม่มีการควบคุมดูแลจะใช้การจัดคลัสเตอร์
วิธีการที่ไม่มีการควบคุมดูแลทำให้รู้วิธีติดป้ายกำกับคลัสเตอร์ข้อมูล
แนวทางที่ไม่มีการควบคุมดูแลไม่ทราบว่ากลุ่มข้อมูลหมายถึงอะไร คุณเป็นผู้กำหนดข้อมูลดังกล่าวเองตามความเข้าใจที่คุณมี

การเรียนรู้แบบเสริมกำลัง

โมเดลการเรียนรู้แบบเสริมกำลัง จะสร้างการคาดคะเนโดยการรับรางวัลหรือบทลงโทษตามการกระทำที่เกิดขึ้นภายในสภาพแวดล้อม ระบบการเรียนรู้แบบเสริมกำลังจะสร้างนโยบายที่กำหนดกลยุทธ์ที่ดีที่สุดในการรับรางวัลมากที่สุด

การเรียนรู้แบบเสริมกำลังใช้เพื่อฝึกหุ่นยนต์ให้ทำงานต่างๆ เช่น เดินไปรอบๆ ห้อง และใช้โปรแกรมซอฟต์แวร์อย่าง AlphaGo เพื่อเล่นเกม Go

Generative AI

Generative AI เป็นรูปแบบโมเดลที่สร้างเนื้อหาจากข้อมูลที่ผู้ใช้ป้อน ตัวอย่างเช่น Generative AI สามารถสร้างรูปภาพใหม่ๆ บทประพันธ์เพลง และมุกตลก อาจสรุปบทความ อธิบายวิธีการทำงาน หรือแก้ไขรูปภาพ

Generative AI สามารถรับอินพุตได้หลากหลายและสร้างเอาต์พุตที่หลากหลาย เช่น ข้อความ รูปภาพ เสียง และวิดีโอ ระบบยังสามารถใช้และสร้าง ชุดค่าผสมเหล่านี้ได้ด้วย ตัวอย่างเช่น โมเดลสามารถนำรูปภาพเป็นอินพุตและสร้างรูปภาพและข้อความเป็นเอาต์พุต หรือถ่ายภาพและข้อความเป็นอินพุตและสร้างวิดีโอเป็นเอาต์พุต

เราสามารถหารือเกี่ยวกับโมเดล Generative ด้วยการป้อนอินพุตและเอาต์พุต ซึ่งโดยทั่วไปจะเขียนเป็น "ประเภทของอินพุต" ต่อ "เอาต์พุต" ตัวอย่างต่อไปนี้เป็นอินพุตและเอาต์พุตบางส่วนสำหรับโมเดล Generative

  • แปลงข้อความเป็นข้อความ
  • จากข้อความเป็นรูปภาพ
  • แปลงข้อความเป็นวิดีโอ
  • การแปลงข้อความ
  • การอ่านออกเสียงข้อความ
  • รูปภาพและข้อความเป็นรูปภาพ

ตารางต่อไปนี้แสดงรายการตัวอย่างโมเดล Generative, อินพุตของโมเดล และตัวอย่างเอาต์พุตที่เป็นไปได้

โมเดล อินพุต ตัวอย่างเอาต์พุต
แปลงข้อความเป็นข้อความ ใครคิดค้นการแข่งขันเลอมองส์ The 24 Hours of Le Mans ก่อตั้งขึ้นโดย Automobile Club de l'Ouest (ACO) ซึ่งเป็นองค์กรยานยนต์ที่ก่อตั้งขึ้นในปี 1906 การแข่งขันนัดแรกจัดขึ้นในวันที่ 26 และ 27 พฤษภาคม 1923 ที่สนามแข่ง Sarthe Circuit ระยะทาง 13.426 กิโลเมตร (8.345 ไมล์) ตั้งอยู่ใกล้กับเมืองเลอมองส์ในฝรั่งเศส เดิมทีเชื้อชาติมีแนวคิดเพื่อส่งเสริม ACO และภูมิภาค Sarthe
แหล่งที่มา: Bard
จากข้อความเป็นรูปภาพ ปลาหมึกเอเลี่ยนลอยผ่านประตูทางเข้ากำลังอ่านหนังสือพิมพ์ รูปการ์ตูนหมึกยักษ์
แหล่งที่มา: รูปภาพ
แปลงข้อความเป็นวิดีโอ ตุ๊กตาหมีแบบสมจริงกำลังว่ายน้ำในมหาสมุทรที่ซานฟรานซิสโก ตุ๊กตาหมีลงไปใต้น้ำ ตุ๊กตาหมียังคงแหวกว่ายใต้น้ำพร้อมกับปลาหลากสีสัน หมีแพนด้ากำลังว่ายน้ำ วิดีโอหมีเท็ดดี้ว่ายน้ำใต้น้ำ
แหล่งที่มา: Phenaki
การแปลงข้อความ เขียนลูป Python ที่วนรอบรายการตัวเลขและพิมพ์จำนวนเฉพาะ
for number in numbers:
  # Check if the number is prime.
  is_prime = True
  for i in range(2, number):
    if number % i == 0:
        is_prime = False
        break
  # If the number is prime, print it.
  if is_prime:
    print(number)

แหล่งที่มา: Bard
รูปภาพเป็นข้อความ รูปนกฟลามิงโก นี่คือนกฟลามิงโก พบได้ในทะเลแคริบเบียน
แหล่งที่มา: Google DeepMind

Generative AI ทำงานอย่างไร ในระดับสูง โมเดล Generative จะเรียนรู้รูปแบบในข้อมูลที่มีเป้าหมายเพื่อสร้างข้อมูลใหม่แต่คล้ายกัน โมเดล Generative มีลักษณะดังนี้

  • นักเล่าเรื่องขำขันที่หัดเลียนแบบผู้อื่นโดยการสังเกตพฤติกรรมและ รูปแบบการพูดของคน
  • ศิลปินที่เรียนรู้การวาดภาพสไตล์ใดสไตล์หนึ่งโดยการศึกษา ภาพวาดในสไตล์นั้นๆ จำนวนมาก
  • วงดนตรีคัฟเวอร์ที่เรียนรู้การฟังดนตรีวงใดวงหนึ่ง ด้วยการฟังเพลงหลายๆ เพลงของวงดนตรีนั้น

ในการสร้างเอาต์พุตที่สร้างสรรค์และไม่ซ้ำใคร โมเดล Generative จะได้รับการฝึกเบื้องต้นโดยใช้แนวทางที่ไม่มีการควบคุมดูแล ซึ่งโมเดลจะเรียนรู้ที่จะเลียนแบบข้อมูลที่ฝึกสอน บางครั้งโมเดลจะได้รับการฝึกเพิ่มเติมโดยใช้การเรียนรู้ภายใต้การควบคุมดูแลหรือการเรียนรู้เสริมเกี่ยวกับข้อมูลเฉพาะที่เกี่ยวข้องกับงานที่โมเดลอาจขอให้ดำเนินการ เช่น สรุปบทความหรือแก้ไขรูปภาพ

Generative AI เป็นเทคโนโลยีที่พัฒนาไปอย่างรวดเร็วและมีกรณีการใช้งานใหม่ๆ ที่เราค้นพบอย่างต่อเนื่อง ตัวอย่างเช่น โมเดล Generative ช่วยให้ธุรกิจปรับแต่งรูปภาพผลิตภัณฑ์อีคอมเมิร์ซของตนด้วยการนำพื้นหลังที่รบกวนสายตาออกโดยอัตโนมัติหรือปรับปรุงคุณภาพของรูปภาพที่มีความละเอียดต่ำ