برای خوشه بندی داده های خود، این مراحل را دنبال می کنید:
- داده ها را آماده کنید.
- معیار تشابه ایجاد کنید
- اجرای الگوریتم خوشه بندی
- نتایج را تفسیر کنید و خوشه بندی خود را تنظیم کنید.
این صفحه به طور خلاصه مراحل را معرفی می کند. در بخش های بعدی به عمق خواهیم پرداخت.
داده ها را آماده کنید
مانند هر مشکل ML، شما باید داده های ویژگی را عادی، مقیاس و تبدیل کنید. با این حال، هنگام خوشهبندی، باید اطمینان حاصل کنید که دادههای آماده شده به شما امکان میدهد شباهت بین مثالها را دقیقاً محاسبه کنید. بخشهای بعدی این ملاحظات را مورد بحث قرار میدهند.
متریک تشابه ایجاد کنید
قبل از اینکه یک الگوریتم خوشهبندی بتواند دادهها را گروهبندی کند، باید بداند که جفتهای مثال چقدر شبیه هم هستند. شما شباهت بین مثال ها را با ایجاد یک متریک شباهت تعیین می کنید. ایجاد یک معیار تشابه مستلزم آن است که داده های خود را به دقت درک کنید و چگونه شباهت را از ویژگی های خود استخراج کنید.
اجرای الگوریتم خوشه بندی
یک الگوریتم خوشه بندی از متریک شباهت برای خوشه بندی داده ها استفاده می کند. این دوره بر روی k-means تمرکز دارد.
نتایج را تفسیر و تنظیم کنید
بررسی کیفیت خروجی خوشهبندی شما تکراری و اکتشافی است زیرا خوشهبندی فاقد «حقیقت» است که بتواند خروجی را تأیید کند. شما نتیجه را بر اساس انتظارات در سطح خوشه و سطح مثال تأیید می کنید. بهبود نتیجه مستلزم آزمایش مکرر مراحل قبلی است تا ببینیم چگونه بر خوشهبندی تأثیر میگذارند.