क्लस्टर करने के लिए वर्कफ़्लो

अपने डेटा को इकट्ठा करने के लिए, आपको यह तरीका अपनाना होगा:

  1. डेटा तैयार करें.
  2. समानता वाली मेट्रिक बनाएं.
  3. क्लस्टरिंग एल्गोरिदम चलाएं.
  4. नतीजों की जानकारी पाएं और अपनी क्लस्टरिंग में बदलाव करें.

इस पेज पर कुछ चरण दिए गए हैं. हम बाद के सेक्शन में इसके बारे में गहराई से जानेंगे.

क्लस्टरिंग वर्कफ़्लो के चार चरण

डेटा तैयार करें

एमएल से जुड़ी किसी भी समस्या की तरह, आपको सुविधा डेटा को सामान्य बनाना, स्केल करना, और बदलना होगा. हालांकि, डेटा को क्लस्टर में बदलते समय, आपको यह भी पक्का करना होगा कि तैयार किए गए डेटा से, उदाहरणों के बीच समानता का सही हिसाब लगाया जा सके. अगले सेक्शन में इस बात पर चर्चा की गई है.

समानता वाली मेट्रिक बनाएं

किसी क्लस्टरिंग एल्गोरिदम में डेटा को ग्रुप करने से पहले, यह जानना ज़रूरी होता है कि मिलते-जुलते उदाहरणों के जोड़े कितने मिलते-जुलते हैं. आप एक समानता मेट्रिक बनाकर उदाहरणों के बीच समानता का आकलन करते हैं. समानता का मेट्रिक बनाने के लिए, आपको अपने डेटा को ध्यान से समझना होगा. साथ ही, यह भी समझना होगा कि इन सुविधाओं से, आपका डेटा कितना मिलता-जुलता है.

क्लस्टरिंग एल्गोरिदम चलाएं

क्लस्टरिंग एल्गोरिदम, डेटा को क्लस्टर करने के लिए समानता मेट्रिक का इस्तेमाल करता है. यह कोर्स k-mean पर फ़ोकस करता है.

नतीजों को समझना और उनमें बदलाव करना

क्लस्टरिंग आउटपुट की क्वालिटी की जांच बार-बार की जाती है और एक्सप्लोरेशन (विश्लेषण का तरीका) किया जाता है. क्योंकि क्लस्टरिंग में “सच” की कमी होती है जिससे आउटपुट की पुष्टि की जा सकती है. आप क्लस्टर-लेवल और उदाहरण-लेवल पर उम्मीद के मुताबिक नतीजे की पुष्टि करते हैं. नतीजे को बेहतर बनाने के लिए, आपको पिछले चरणों के साथ बार-बार प्रयोग करना होगा. इससे आपको यह पता चलेगा कि वे क्लस्टरिंग पर कैसे असर डालते हैं.