แมชชีนเลิร์นนิงคืออะไร

แมชชีนเลิร์นนิง (ML) ขับเคลื่อนเทคโนโลยีที่สำคัญที่สุดบางอย่างที่เราใช้ ตั้งแต่แอปแปลภาษาไปจนถึงยานพาหนะที่ขับเคลื่อนอัตโนมัติ หลักสูตรนี้อธิบายแนวคิดหลัก เบื้องหลัง ML

ML เป็นวิธีใหม่ในการแก้ปัญหา ตอบคำถามที่ซับซ้อน และสร้างเนื้อหาใหม่ ML สามารถพยากรณ์อากาศ คาดคะเนเวลาเดินทาง แนะนำเพลง เติมประโยคอัตโนมัติ สรุปบทความ และสร้างรูปภาพที่ไม่เคยมีมาก่อน

กล่าวโดยง่าย ML คือกระบวนการฝึกซอฟต์แวร์ชิ้นหนึ่งที่เรียกว่าโมเดล เพื่อสร้างการคาดการณ์ที่เป็นประโยชน์หรือสร้างเนื้อหา (เช่น ข้อความ รูปภาพ เสียง หรือวิดีโอ) จากข้อมูล

ตัวอย่างเช่น สมมติว่าเราต้องการสร้างแอปเพื่อคาดการณ์ปริมาณน้ำฝน เราอาจ ใช้วิธีการแบบเดิมหรือวิธีการ ML ก็ได้ หากใช้แนวทางแบบเดิม เราจะต้องสร้างการแสดงผลตามหลักฟิสิกส์ของชั้นบรรยากาศและพื้นผิวโลก และคำนวณสมการพลศาสตร์ของไหลจำนวนมหาศาล ซึ่งเป็นเรื่องที่ ยากมาก

การใช้แนวทาง ML เราจะให้ข้อมูลสภาพอากาศจำนวนมหาศาลแก่โมเดล ML จนกว่าโมเดล ML จะเรียนรู้ความสัมพันธ์ทางคณิตศาสตร์ระหว่าง รูปแบบสภาพอากาศที่ทำให้เกิดปริมาณฝนที่แตกต่างกัน จากนั้นเราจะให้ข้อมูลสภาพอากาศปัจจุบันแก่โมเดล และโมเดลจะคาดการณ์ปริมาณฝน

ทดสอบความเข้าใจ

"โมเดล" ในแมชชีนเลิร์นนิงคืออะไร
โมเดลคือความสัมพันธ์ทางคณิตศาสตร์ที่ได้มาจากข้อมูลซึ่งระบบ ML ใช้ในการคาดการณ์
โมเดลคือชิ้นส่วนฮาร์ดแวร์คอมพิวเตอร์
โมเดลคือการแสดงสิ่งที่กำลังศึกษาในขนาดที่เล็กลง

ประเภทของระบบ ML

ระบบ ML จะอยู่ในหมวดหมู่ต่อไปนี้อย่างน้อย 1 หมวดหมู่ โดยขึ้นอยู่กับวิธีที่ระบบ เรียนรู้ที่จะทำการคาดการณ์หรือสร้างเนื้อหา

  • การเรียนรู้ที่มีการควบคุมดูแล
  • การเรียนรู้ที่ไม่มีการควบคุมดูแล
  • การเรียนรู้แบบเสริมกำลัง
  • Generative AI

การเรียนรู้ที่มีการควบคุมดูแล

โมเดลการเรียนรู้ภายใต้การควบคุมดูแล สามารถทําการคาดการณ์ได้หลังจากเห็นข้อมูลจํานวนมากที่มีคําตอบที่ถูกต้อง และค้นพบความเชื่อมโยงระหว่างองค์ประกอบในข้อมูลที่ สร้างคําตอบที่ถูกต้อง ซึ่งคล้ายกับการที่นักเรียนเรียนรู้เนื้อหาใหม่โดย ศึกษาข้อสอบเก่าที่มีทั้งคำถามและคำตอบ เมื่อนักเรียน ฝึกทำข้อสอบเก่ามากพอแล้ว นักเรียนก็จะพร้อมทำข้อสอบใหม่ ระบบ ML เหล่านี้เป็นระบบ "ภายใต้การกำกับดูแล" ในแง่ที่ว่ามนุษย์จะให้ข้อมูลแก่ระบบ ML พร้อมผลลัพธ์ที่ถูกต้องที่ทราบ

กรณีการใช้งานที่พบบ่อยที่สุด 2 กรณีสำหรับการเรียนรู้ภายใต้การควบคุมคือการถดถอยและ การจัดประเภท

การถดถอย

โมเดลการถดถอยจะคาดการณ์ค่าตัวเลข ตัวอย่างเช่น โมเดลสภาพอากาศที่คาดการณ์ปริมาณน้ำฝนเป็นนิ้วหรือมิลลิเมตรคือโมเดลการถดถอย

ดูตัวอย่างเพิ่มเติมของโมเดลการถดถอยได้ในตารางด้านล่าง

สถานการณ์ ข้อมูลอินพุตที่เป็นไปได้ การคาดการณ์ตัวเลข
ราคาบ้านในอนาคต พื้นที่ รหัสไปรษณีย์ จำนวนห้องนอนและห้องน้ำ ขนาดที่ดิน อัตราดอกเบี้ยจำนอง อัตราภาษีที่ดิน ค่าก่อสร้าง และ จำนวนบ้านที่ขายในพื้นที่ ราคาของบ้าน
เวลาการเดินทางในอนาคต สภาพการจราจรในอดีต (รวบรวมจากสมาร์ทโฟน เซ็นเซอร์การจราจร แอปเรียกรถ และแอปนำทางอื่นๆ) ระยะทางจากจุดหมาย และสภาพอากาศ เวลาเป็นนาทีและวินาทีในการเดินทางถึงจุดหมาย

การจัดประเภท

โมเดลการจัดประเภทคาดการณ์ ความเป็นไปได้ที่รายการหนึ่งๆ จะอยู่ในหมวดหมู่ โมเดลการจัดประเภทจะแสดงค่าที่ระบุว่ามีสิ่งใดอยู่ในหมวดหมู่หนึ่งๆ หรือไม่ ซึ่งแตกต่างจากโมเดลการถดถอย ที่แสดงผลเป็นตัวเลข ตัวอย่างเช่น โมเดลการแยกประเภทใช้เพื่อคาดการณ์ว่าอีเมลเป็นสแปมหรือไม่ หรือรูปภาพ มีแมวหรือไม่

โมเดลการจัดประเภทแบ่งออกเป็น 2 กลุ่ม ได้แก่ การจัดประเภทแบบไบนารีและการจัดประเภทแบบหลายคลาส โมเดลการจัดประเภทแบบไบนารีจะแสดงค่าจากคลาสที่มีค่าเพียง 2 ค่า เช่น โมเดลที่แสดง rain หรือ no rain โมเดลการแยกประเภทแบบหลายคลาสจะแสดงค่าจากคลาสที่มีค่ามากกว่า 2 ค่า เช่น โมเดลที่แสดงค่าเป็น rain, hail, snow หรือ sleet

ทดสอบความเข้าใจ

หากต้องการใช้โมเดล ML เพื่อคาดการณ์การใช้พลังงานของอาคารเชิงพาณิชย์ คุณจะใช้โมเดลประเภทใด
การถดถอย
การใช้พลังงานวัดเป็นกิโลวัตต์ชั่วโมง (kWh) ซึ่งเป็นตัวเลข ดังนั้นคุณจึงควรใช้โมเดลการถดถอย
การจัดประเภท
โมเดลการจัดประเภทจะคาดการณ์ว่าสิ่งหนึ่งๆ อยู่ในหมวดหมู่หรือไม่ ในขณะที่โมเดลการเกิดปัญหาซ้ำจะคาดการณ์ตัวเลข เนื่องจากการใช้พลังงาน วัดเป็นกิโลวัตต์ชั่วโมง (kWh) ซึ่งเป็นตัวเลข คุณจึง ควรใช้โมเดลการถดถอย

การเรียนรู้ที่ไม่มีการควบคุมดูแล

โมเดลการเรียนรู้แบบไม่มีผู้ดูแล มีเป้าหมายเพื่อระบุรูปแบบที่มีความหมายในชุดข้อมูล ตัวอย่างเช่น โมเดลการเรียนรู้แบบไม่มีผู้ดูแลจำนวนมากอาศัยเทคนิคที่เรียกว่าการจัดกลุ่มเพื่อจัดระเบียบข้อมูลที่คล้ายกัน เป็นกลุ่ม ("คลัสเตอร์")

รูปภาพแสดงจุดสีต่างๆ เป็นกลุ่ม

รูปที่ 1 โมเดล ML ที่จัดกลุ่มจุดข้อมูลที่คล้ายกัน

รูปภาพแสดงจุดสีที่รวมกันเป็นกลุ่มซึ่งอยู่ในรูปร่างและมีขอบติดกัน

รูปที่ 2 กลุ่มคลัสเตอร์ที่มีการแบ่งเขตตามธรรมชาติ

การจัดกลุ่มแตกต่างจากการจัดประเภทเนื่องจากหมวดหมู่ไม่ได้กำหนดโดยคุณ ตัวอย่างเช่น โมเดลแบบไม่มีการกำกับดูแลอาจจัดกลุ่มชุดข้อมูลสภาพอากาศตาม อุณหภูมิ ซึ่งเผยให้เห็นการแบ่งกลุ่มที่กำหนดฤดูกาล จากนั้นคุณอาจ พยายามตั้งชื่อคลัสเตอร์เหล่านั้นตามความเข้าใจชุดข้อมูล

รูปภาพแสดงจุดสีเป็นกลุ่มที่มีป้ายกำกับว่าหิมะ ฝน ลูกเห็บ และไม่มีฝน

รูปที่ 3 โมเดล ML ที่จัดกลุ่มรูปแบบสภาพอากาศที่คล้ายกัน

รูปภาพแสดงจุดสีเป็นกลุ่มที่มีป้ายกำกับว่าหิมะ ฝน ลูกเห็บ และไม่มีฝน ซึ่งอยู่ในรูปร่างและมีเส้นขอบติดกัน

รูปที่ 4 กลุ่มรูปแบบสภาพอากาศที่มีป้ายกำกับเป็นหิมะ ลูกเห็บ ฝน และไม่มีฝน

ทดสอบความเข้าใจ

แนวทางที่มีการควบคุมดูแลแตกต่างจากแนวทางที่ไม่มีการควบคุมดูแลอย่างไร
วิธีการที่มีการกำกับดูแลจะได้รับข้อมูลที่มีคำตอบที่ถูกต้อง
วิธีการที่มีการกำกับดูแลจะได้รับข้อมูลที่มีคำตอบที่ถูกต้อง หน้าที่ของโมเดลคือการค้นหาความเชื่อมโยงในข้อมูลที่ให้คำตอบที่ถูกต้อง วิธีการแบบไม่มีการกำกับดูแลจะได้รับข้อมูลโดยไม่มีคำตอบที่ถูกต้อง หน้าที่ของมัน คือการค้นหากลุ่มในข้อมูล
โดยปกติแล้วแนวทางที่มีการควบคุมดูแลจะใช้การจัดกลุ่ม
แนวทางแบบไม่มีการกำกับดูแลจะใช้การจัดกลุ่ม
แนวทางแบบไม่มีการกำกับดูแลจะทราบวิธีติดป้ายกำกับกลุ่มข้อมูล
แนวทางแบบไม่มีการกำกับดูแลไม่ทราบว่าคลัสเตอร์ของข้อมูลหมายถึงอะไร คุณต้องเป็นผู้กำหนดค่าเหล่านี้ตามความเข้าใจในข้อมูล

การเรียนรู้แบบเสริมกำลัง

โมเดลการเรียนรู้แบบเสริมกำลัง จะทำการคาดการณ์โดยรับรางวัล หรือบทลงโทษตามการกระทำที่ดำเนินการภายในสภาพแวดล้อม ระบบการเรียนรู้แบบเสริมกำลัง จะสร้างนโยบายที่ กำหนดกลยุทธ์ที่ดีที่สุดในการรับรางวัลมากที่สุด

การเรียนรู้แบบเสริมกำลังใช้ในการฝึกหุ่นยนต์ให้ทำงานต่างๆ เช่น เดิน ไปรอบๆ ห้อง และโปรแกรมซอฟต์แวร์อย่าง AlphaGo เพื่อเล่นเกมโกะ

Generative AI

Generative AI คือโมเดลประเภทหนึ่ง ที่สร้างเนื้อหาจากข้อมูลที่ผู้ใช้ป้อน เช่น Generative AI สามารถสร้าง รูปภาพ เพลง และมุกตลกที่ไม่ซ้ำใคร สรุปบทความ อธิบายวิธีทำงาน หรือแก้ไขรูปภาพ

Generative AI สามารถรับอินพุตได้หลากหลายและสร้างเอาต์พุตได้หลากหลาย เช่น ข้อความ รูปภาพ เสียง และวิดีโอ นอกจากนี้ยังสามารถใช้และสร้างการผสมผสานของ สิ่งเหล่านี้ได้ด้วย เช่น โมเดลสามารถรับรูปภาพเป็นอินพุตและสร้างรูปภาพและข้อความเป็นเอาต์พุต หรือรับรูปภาพและข้อความเป็นอินพุตและสร้างวิดีโอเป็นเอาต์พุต

เราสามารถพูดถึงโมเดล Generative ตามอินพุตและเอาต์พุตของโมเดล ซึ่งโดยทั่วไปจะเขียนเป็น "ประเภทอินพุต" เป็น "ประเภทเอาต์พุต" ตัวอย่างเช่น รายการอินพุตและเอาต์พุตบางส่วนสำหรับโมเดล Generative มีดังนี้

  • ข้อความเป็นข้อความ
  • การเปลี่ยนข้อความเป็นรูปภาพ
  • เปลี่ยนข้อความเป็นวิดีโอ
  • เปลี่ยนข้อความเป็นโค้ด
  • การอ่านออกเสียงข้อความ
  • รูปภาพและข้อความเป็นรูปภาพ

ตารางต่อไปนี้แสดงตัวอย่างโมเดล Generative, อินพุต และเอาต์พุตที่เป็นไปได้

รุ่น อินพุต ตัวอย่างเอาต์พุต
ข้อความเป็นข้อความ ใครเป็นผู้คิดค้นการแข่งขันเลอม็อง การแข่งขัน 24 Hours of Le Mans ก่อตั้งขึ้นโดย Automobile Club de l'Ouest (ACO) ซึ่งเป็นองค์กรด้านยานยนต์ที่ก่อตั้งขึ้นในปี 1906 การแข่งขันครั้งแรกจัดขึ้น ในวันที่ 26 และ 27 พฤษภาคม 1923 ที่สนามแข่งซาร์ต ซึ่งเป็นสนามแข่งบนถนนยาว 13.426 กิโลเมตร (8.345 ไมล์) ใกล้กับเมืองเลอม็องในฝรั่งเศส การแข่งขันนี้เดิมทีมีแนวคิดเพื่อโปรโมต ACO และแคว้นซาร์ต
แหล่งที่มา: Bard
การเปลี่ยนข้อความเป็นรูปภาพ ปลาหมึกต่างดาวลอยผ่านพอร์ทัลขณะอ่านหนังสือพิมพ์ รูปภาพการ์ตูนปลาหมึก
แหล่งที่มา: Imagen
เปลี่ยนข้อความเป็นวิดีโอ ตุ๊กตาหมีเหมือนจริงกำลังว่ายน้ำในมหาสมุทรที่ซานฟรานซิสโก หมีเท็ดดี้ดำน้ำ ตุ๊กตาหมีว่ายน้ำอยู่ใต้น้ำกับปลาสีสันสดใส หมีแพนด้ากำลังว่ายน้ำใต้น้ำ วิดีโอหมีเท็ดดี้ว่ายน้ำใต้น้ำ
แหล่งที่มา: Phenaki
เปลี่ยนข้อความเป็นโค้ด เขียนลูป Python ที่วนซ้ำในรายการตัวเลขและพิมพ์จำนวนเฉพาะ
for number in numbers:
  # Check if the number is prime.
  is_prime = True
  for i in range(2, number):
    if number % i == 0:
        is_prime = False
        break
  # If the number is prime, print it.
  if is_prime:
    print(number)

แหล่งที่มา: Bard
รูปภาพเป็นข้อความ รูปภาพนกฟลามิงโก นี่คือนกฟลามิงโก โดยพบในแถบแคริบเบียน
แหล่งที่มา: Google DeepMind

Generative AI ทำงานอย่างไร ในภาพรวม โมเดล Generative จะเรียนรู้รูปแบบในข้อมูลโดยมีเป้าหมายเพื่อสร้างข้อมูลใหม่ที่คล้ายกัน โมเดล แบบ Generative มีลักษณะดังนี้

  • นักแสดงตลกที่เรียนรู้การเลียนแบบผู้อื่นด้วยการสังเกตพฤติกรรมและ สไตล์การพูดของผู้คน
  • ศิลปินที่เรียนรู้การวาดภาพในสไตล์หนึ่งๆ โดยการศึกษาภาพวาดจำนวนมากในสไตล์นั้น
  • วงคัฟเวอร์ที่ฝึกให้มีเสียงเหมือนวงดนตรีวงหนึ่งๆ โดยการฟังเพลงของวงนั้นๆ เป็นจำนวนมาก

โมเดล Generative จะได้รับการฝึกครั้งแรกโดยใช้วิธีการแบบไม่มีการกำกับดูแล ซึ่งโมเดลจะเรียนรู้ที่จะเลียนแบบข้อมูลที่ใช้ฝึก เพื่อสร้างเอาต์พุตที่ไม่ซ้ำกันและสร้างสรรค์ บางครั้งโมเดลจะได้รับการฝึกเพิ่มเติมโดยใช้การเรียนรู้แบบมีผู้ดูแลหรือการเรียนรู้แบบเสริมกำลังในข้อมูลเฉพาะที่เกี่ยวข้องกับงานที่โมเดลอาจได้รับคำสั่งให้ทำ เช่น สรุปบทความหรือแก้ไขรูปภาพ

Generative AI เป็นเทคโนโลยีที่เปลี่ยนแปลงอย่างรวดเร็ว และมีการค้นพบกรณีการใช้งานใหม่ๆ อยู่เสมอ ตัวอย่างเช่น โมเดล Generative ช่วยให้ธุรกิจปรับแต่ง รูปภาพผลิตภัณฑ์อีคอมเมิร์ซได้โดยการนำพื้นหลังที่รบกวนออกโดยอัตโนมัติ หรือปรับปรุงคุณภาพของรูปภาพที่มีความละเอียดต่ำ