خوشه بندی گردش کار

برای خوشه بندی داده های خود، این مراحل را دنبال می کنید:

  1. داده ها را آماده کنید.
  2. معیار تشابه ایجاد کنید
  3. اجرای الگوریتم خوشه بندی
  4. نتایج را تفسیر کنید و خوشه بندی خود را تنظیم کنید.

این صفحه به طور خلاصه مراحل را معرفی می کند. در بخش های بعدی به عمق خواهیم پرداخت.

چهار مرحله گردش کار خوشه بندی

داده ها را آماده کنید

مانند هر مشکل ML، شما باید داده های ویژگی را عادی، مقیاس و تبدیل کنید. با این حال، هنگام خوشه‌بندی، باید اطمینان حاصل کنید که داده‌های آماده شده به شما امکان می‌دهد شباهت بین مثال‌ها را دقیقاً محاسبه کنید. بخش‌های بعدی این ملاحظات را مورد بحث قرار می‌دهند.

متریک تشابه ایجاد کنید

قبل از اینکه یک الگوریتم خوشه‌بندی بتواند داده‌ها را گروه‌بندی کند، باید بداند که جفت‌های مثال چقدر شبیه هم هستند. شما شباهت بین مثال ها را با ایجاد یک متریک شباهت تعیین می کنید. ایجاد یک معیار تشابه مستلزم آن است که داده های خود را به دقت درک کنید و چگونه شباهت را از ویژگی های خود استخراج کنید.

اجرای الگوریتم خوشه بندی

یک الگوریتم خوشه بندی از متریک شباهت برای خوشه بندی داده ها استفاده می کند. این دوره بر روی k-means تمرکز دارد.

نتایج را تفسیر و تنظیم کنید

بررسی کیفیت خروجی خوشه‌بندی شما تکراری و اکتشافی است زیرا خوشه‌بندی فاقد «حقیقت» است که بتواند خروجی را تأیید کند. شما نتیجه را بر اساس انتظارات در سطح خوشه و سطح مثال تأیید می کنید. بهبود نتیجه مستلزم آزمایش مکرر مراحل قبلی است تا ببینیم چگونه بر خوشه‌بندی تأثیر می‌گذارند.