सही संख्या वाला डेटा
को सही तरीके से गुणा किया जा सकता है. उदाहरण के लिए,
ऐसा मॉडल जो इलाके के हिसाब से, किसी घर की वैल्यू का अनुमान लगाता है.
ध्यान दें कि घर की कीमतों का आकलन करने के लिए, एक काम का मॉडल आम तौर पर इन
सुविधाओं का इस्तेमाल करें. बाकी सब कुछ बराबर है, 200 वर्ग का घर
मीटर की वैल्यू, 100 स्क्वेयर वाले किसी घर के मुकाबले करीब दोगुनी होनी चाहिए
मीटर.
अक्सर, आपको उन सुविधाओं को इस रूप में प्रस्तुत करना चाहिए जिनमें पूर्णांक मान
कैटगरी वाले डेटा का इस्तेमाल करें. उदाहरण के लिए,
कोड सुविधा जिसमें मान पूर्णांक होते हैं. अगर आपको
साफ़ तौर पर बताने की बजाय अंकों के आधार पर, आप मॉडल के लिए
और उनके बीच
पिन कोड के लिए एक से ज़्यादा कोड इस्तेमाल करें. इसका मतलब है कि मॉडल को यह कहा जा रहा है कि
पिन कोड 20004 को बड़े सिग्नल के तौर पर पिन कोड के तौर पर दो बार (या आधे) के तौर पर इस्तेमाल करें
10,002 है. पिन कोड को कैटगरी वाले डेटा के तौर पर दिखाने पर, यह मॉडल
हर पिन कोड को अलग-अलग अहमियत दें.
एन्कोडिंग
एन्कोडिंग का मतलब है कैटगरी या अन्य डेटा को संख्या वाले वेक्टर में बदलना
जिसे मॉडल ट्रेनिंग दे सके. यह कन्वर्ज़न ज़रूरी है, क्योंकि मॉडल ये काम कर सकते हैं
सिर्फ़ फ़्लोटिंग-पॉइंट वैल्यू पर ट्रेन करें; मॉडल इन स्ट्रिंग पर ट्रेनिंग नहीं कर सकते:
"dog" या "maple". यह मॉड्यूल अलग-अलग जानकारी देता है
कैटगरी वाले डेटा को कोड में बदलने के तरीके.
[[["समझने में आसान है","easyToUnderstand","thumb-up"],["मेरी समस्या हल हो गई","solvedMyProblem","thumb-up"],["अन्य","otherUp","thumb-up"]],[["वह जानकारी मौजूद नहीं है जो मुझे चाहिए","missingTheInformationINeed","thumb-down"],["बहुत मुश्किल है / बहुत सारे चरण हैं","tooComplicatedTooManySteps","thumb-down"],["पुराना","outOfDate","thumb-down"],["अनुवाद से जुड़ी समस्या","translationIssue","thumb-down"],["सैंपल / कोड से जुड़ी समस्या","samplesCodeIssue","thumb-down"],["अन्य","otherDown","thumb-down"]],["आखिरी बार 2024-08-13 (UTC) को अपडेट किया गया."],[[["This module focuses on differentiating between categorical and numerical data within machine learning."],["You will learn how to represent categorical data using one-hot vectors and address common issues associated with it."],["The module covers encoding techniques for converting categorical data into numerical vectors suitable for model training."],["Feature crosses, a method for combining categorical features to capture interactions, are also discussed."],["It is assumed you have prior knowledge of introductory machine learning and working with numerical data."]]],[]]