Jika memulai project machine learning (ML) baru, Anda mungkin bertanya-tanya jika pelatihan manual adalah satu-satunya pilihan Anda untuk membuat model machine learning. Dengan pelatihan manual, Anda menulis kode menggunakan framework ML untuk membuat model. Selama proses ini, Anda memilih algoritma mana yang akan dijelajahi dan disesuaikan secara berulang hyperparameter untuk menemukan model yang tepat.
Tentu saja, pelatihan model bukanlah satu-satunya hal yang perlu Anda pikirkan. Di beberapa latihan, membangun model machine learning dari prototipe hingga produksi melibatkan tugas-tugas berulang dan keterampilan khusus. ML eksploratif sederhana alur kerja terlihat seperti ini:
Tugas berulang - Alur kerja ML dapat melibatkan pekerjaan berulang dan eksperimen. Misalnya, selama pengembangan model, Anda biasanya perlu mengeksplorasi berbagai kombinasi algoritma dan hyperparameter untuk mengidentifikasi model yang paling tepat. Dengan pelatihan manual, Anda menulis kode khusus untuk melatih model, lalu menyesuaikan kode untuk menjalankan eksperimen dengan berbagai ML algoritma dan hyperparameter untuk menemukan model yang terbaik. Untuk eksplorasi kecil atau eksplorasi proyek, proses manual ini mungkin tidak menjadi masalah, tetapi untuk proyek yang lebih besar tugas-tugas berulang bisa memakan waktu.
Keterampilan Khusus - Mengembangkan model ML secara manual melibatkan keterampilan mereka. Dalam praktiknya, tidak semua tim yang berencana mengembangkan model machine learning mungkin memiliki keterampilan ini. Jika sebuah tim tidak memiliki data scientist khusus, melakukan pekerjaan ini secara manual bahkan mungkin tidak memungkinkan.
Untungnya, langkah-langkah tertentu dalam pengembangan model dapat diotomatiskan untuk mengurangi beban pekerjaan berulang dan kebutuhan akan keterampilan khusus. Mengotomatiskan tugas ini adalah subjek modul tentang machine learning otomatis (AutoML).
Apa itu AutoML?
AutoML adalah proses otomatisasi tugas tertentu dalam alur kerja machine learning. Anda dapat menganggap AutoML sebagai serangkaian alat dan teknologi yang menjadikan proses membangun model machine learning dengan lebih cepat dan lebih mudah diakses oleh kelompok pengguna yang lebih luas. Meskipun otomatisasi dapat membantu di seluruh alur kerja ML, tugas yang sering yang terkait dengan AutoML adalah yang termasuk dalam siklus pengembangan model yang ditunjukkan pada Gambar 1. Tugas berulang ini meliputi:
- Data Engineering
- Rekayasa fitur.
- Pilihan fitur.
- Pelatihan
- Mengidentifikasi algoritma ML yang tepat.
- Memilih hyperparameter terbaik.
- Analisis
- Mengevaluasi metrik yang dihasilkan selama pelatihan berdasarkan validasi.
Dengan AutoML, Anda dapat berfokus pada masalah dan data ML, bukan pada fitur pemilihan, penyesuaian hyperparameter, dan pemilihan algoritma yang tepat.