Alur Kerja Pengelompokan

Untuk mengelompokkan data, Anda harus mengikuti langkah-langkah berikut:

  1. Siapkan data.
  2. Buat metrik kesamaan.
  3. Jalankan algoritme pengelompokan.
  4. Menafsirkan hasil dan menyesuaikan pengelompokan Anda.

Halaman ini memperkenalkan langkah-langkahnya secara singkat. Kita akan mendalami bagian-bagian berikutnya.

Keempat langkah alur kerja pengelompokan

Siapkan Data

Seperti masalah ML lainnya, Anda harus menormalisasi, menskalakan, dan mentransformasi data fitur. Namun, saat mengelompokkan, Anda juga harus memastikan bahwa data yang disiapkan memungkinkan Anda menghitung kesamaan di antara contoh secara akurat. Bagian selanjutnya akan membahas pertimbangan ini.

Buat Metrik Kemiripan

Sebelum algoritme pengelompokan dapat mengelompokkan data, algoritme tersebut harus mengetahui seberapa mirip pasangan contoh. Anda mengukur kemiripan di antara contoh dengan membuat metrik kesamaan. Untuk membuat metrik kesamaan, Anda harus memahami data dengan cermat dan cara mendapatkan kesamaan dari fitur.

Algoritme Pengelompokan Lari

Algoritme pengelompokan menggunakan metrik kesamaan untuk mengelompokkan data. Kursus ini berfokus pada k- diperoleh.

Menafsirkan Hasil dan Menyesuaikan

Memeriksa kualitas output pengelompokan Anda bersifat berulang dan eksplorasi karena pengelompokan tidak memiliki “kebenaran” yang dapat memverifikasi output. Anda memverifikasi hasilnya terhadap ekspektasi di level cluster dan contoh level. Meningkatkan hasil membutuhkan eksperimen berulang pada langkah sebelumnya untuk melihat bagaimana pengaruhnya terhadap cluster.