เวิร์กโฟลว์แบบคลัสเตอร์

หากต้องการจัดกลุ่มข้อมูล ให้ทําตามขั้นตอนต่อไปนี้

  1. เตรียมข้อมูล
  2. สร้างเมตริกที่คล้ายกัน
  3. เรียกใช้อัลกอริทึมการจัดกลุ่ม
  4. ตีความผลลัพธ์และปรับคลัสเตอร์

หน้านี้จะแนะนําขั้นตอนโดยสรุป เราจะเจาะลึกในส่วนถัดไป

4 ขั้นตอนของเวิร์กโฟลว์คลัสเตอร์

เตรียมข้อมูล

เช่นเดียวกับปัญหาของ ML คุณต้องปรับข้อมูล ปรับขนาด และเปลี่ยนรูปแบบข้อมูลให้เป็นมาตรฐาน อย่างไรก็ตาม ขณะรวมกลุ่ม ต้องมีการตรวจสอบด้วยว่า ข้อมูลความพร้อมช่วยให้คุณคํานวณความคล้ายคลึงกันระหว่างตัวอย่างได้อย่างแม่นยํา ส่วนถัดไปพูดถึง การพิจารณานี้

สร้างเมตริกที่คล้ายกัน

ก่อนที่อัลกอริทึมการจัดกลุ่มจะจัดกลุ่มข้อมูลได้ ระบบจึงต้องทราบว่าตัวอย่างที่คล้ายกันเป็นเท่าใด คุณวัดความคล้ายคลึงระหว่างตัวอย่างได้โดยการสร้างเมตริกความคล้ายคลึง ในการสร้างเมตริกที่คล้ายกัน คุณจะต้องทําความเข้าใจข้อมูลอย่างละเอียดและวิธีที่จะดึงความคล้ายคลึงกันจากฟีเจอร์ต่างๆ มาใช้

เรียกใช้อัลกอริทึมการจัดกลุ่ม

อัลกอริทึมการจัดกลุ่มใช้เมตริกความคล้ายคลึงกันเพื่อจัดกลุ่มข้อมูล หลักสูตรนี้มุ่งเน้นที่ K-Mean

แปลความหมายผลลัพธ์และปรับ

การตรวจสอบคุณภาพของเอาต์พุตของคลัสเตอร์จะเป็นแบบทําซ้ําและการสํารวจ เนื่องจากการจัดกลุ่มไม่มี "ความจริง" ที่ยืนยันเอาต์พุตได้ คุณตรวจสอบผลลัพธ์กับความคาดหวังที่ระดับคลัสเตอร์และระดับตัวอย่าง การปรับปรุงผลลัพธ์ต้องใช้การทดสอบกับขั้นตอนก่อนหน้านี้ซ้ําๆ เพื่อดูว่ามีผลต่อคลัสเตอร์อย่างไร