หากคุณกำลังเริ่มโปรเจ็กต์แมชชีนเลิร์นนิง (ML) ใหม่ คุณอาจสงสัยว่า หากการฝึกด้วยตนเองเป็นตัวเลือกเดียวในการสร้างโมเดลแมชชีนเลิร์นนิง ด้วย ด้วยตนเอง คุณต้องเขียนโค้ดโดยใช้เฟรมเวิร์ก ML เพื่อสร้างโมเดล ระหว่าง ในขั้นตอนนี้ คุณจะเลือกอัลกอริทึมที่จะสำรวจและปรับแต่ง ไฮเปอร์พารามิเตอร์เพื่อค้นหาโมเดลที่ถูกต้อง
แน่นอนว่าการฝึกโมเดลไม่ใช่สิ่งเดียวที่คุณต้องคำนึงถึง ใน การฝึกปฏิบัติ การสร้างโมเดลแมชชีนเลิร์นนิง จากต้นแบบไปสู่การผลิต เกี่ยวข้องกับงานที่ต้องทำซ้ำๆ และทักษะเฉพาะทาง ML สำรวจแบบง่าย เวิร์กโฟลว์จะมีลักษณะดังนี้
งานที่ทำซ้ำๆ - เวิร์กโฟลว์ ML อาจมีการทำงานซ้ำๆ และ ในการทดสอบ ตัวอย่างเช่น ระหว่างการพัฒนาโมเดล โดยทั่วไปคุณจะต้อง สำรวจการผสมผสานระหว่างอัลกอริทึมและไฮเปอร์พารามิเตอร์ต่างๆ เพื่อระบุ รูปแบบที่เหมาะสมที่สุด ในการฝึกอบรมด้วยตนเอง คุณจะต้องเขียนโค้ดพิเศษเพื่อ ฝึกโมเดลแล้วปรับแต่งโค้ดเพื่อทำการทดสอบด้วย ML ต่างๆ อัลกอริทึมและไฮเปอร์พารามิเตอร์เพื่อค้นหาโมเดลที่ดีที่สุด สำหรับคนขนาดเล็กหรือการสำรวจ การดำเนินการด้วยตนเองนี้อาจไม่เป็นปัญหา แต่สำหรับโปรเจ็กต์ขนาดใหญ่ งานที่ต้องทำซ้ำๆ อาจใช้เวลามาก
ทักษะเฉพาะทาง - การพัฒนาโมเดล ML ด้วยตนเองเกี่ยวข้องกับผู้ที่มีความเชี่ยวชาญ ทักษะพิเศษ ในทางปฏิบัติ บางทีมไม่ได้วางแผนพัฒนาโมเดลแมชชีนเลิร์นนิง ก็อาจมีทักษะเหล่านี้ ถ้าทีมไม่มีนักวิทยาศาสตร์ข้อมูลโดยเฉพาะ ด้วยตนเองก็อาจทำไม่ได้
แต่โชคดีที่ขั้นตอนบางขั้นตอนในการพัฒนาโมเดลสามารถเป็นแบบอัตโนมัติได้เพื่อลด เป็นภาระการทำงานซ้ำๆ และความต้องการทักษะเฉพาะด้าน ทำให้รายการเหล่านี้ทำงานอัตโนมัติ งานจะเป็นหัวข้อของโมดูลนี้ในแมชชีนเลิร์นนิงแบบอัตโนมัติ (AutoML)
AutoML คืออะไร
AutoML เป็นกระบวนการที่ทำให้เป็นอัตโนมัติ งานบางอย่างในเวิร์กโฟลว์ แมชชีนเลิร์นนิง คุณอาจมองว่า AutoML เป็นชุดเครื่องมือและเทคโนโลยีที่สร้าง โมเดลแมชชีนเลิร์นนิงทำงานได้เร็วขึ้นและเข้าถึงได้มากขึ้นสำหรับกลุ่มผู้ใช้ที่กว้างขึ้น แม้ว่าการทำงานอัตโนมัติจะช่วยตลอดเวิร์กโฟลว์ ML แต่งานที่มักจะ ที่เชื่อมโยงกับ AutoML คือรายการที่รวมอยู่ในรอบการพัฒนาโมเดล แสดงในรูปที่ 1 งานที่ต้องทำซ้ำๆ ได้แก่
- วิศวกรรมข้อมูล
- Feature Engineering
- การเลือกฟีเจอร์
- การฝึกอบรม
- ระบุอัลกอริทึม ML ที่เหมาะสม
- เลือกไฮเปอร์พารามิเตอร์ที่ดีที่สุด
- การวิเคราะห์
- การประเมินเมตริกที่สร้างขึ้นระหว่างการฝึกโดยอิงจากการทดสอบและ ชุดข้อมูลตรวจสอบความถูกต้อง
การใช้ AutoML จะช่วยให้คุณโฟกัสที่ปัญหาและข้อมูล ML แทนที่จะมุ่งเน้นไปที่ฟีเจอร์ การเลือก การปรับแต่งไฮเปอร์พารามิเตอร์ และการเลือกอัลกอริทึมที่เหมาะสม