संख्यात्मक डेटा में बदलाव करना

आपको अंकों वाले डेटा पर दो तरह के बदलाव लागू करने पड़ सकते हैं:

  • सामान्य बनाना - संख्या वाले डेटा को उसी तरह के स्केल के साथ बदलना जो अंकों और डेटा का होता है.
  • बकी करना - अंकों में बंटे डेटा को, आम तौर पर (लगातार) डेटा में बदलना.

संख्या वाली सुविधाएं सामान्य क्यों करें?

हम डेटा सेट को सामान्य बनाने की सलाह देते हैं. इसमें ऐसे न्यूमेरिक फ़ीचर होते हैं जो अलग-अलग रेंज में शामिल हों. जैसे, उम्र और आय. जब अलग-अलग सुविधाएं अलग-अलग होती हैं, तो ग्रेडिएंट ढलानों से "बाउंस&कोटेशन; और स्लोवर्स कम हो सकते हैं. Adagrad और ऐडम जैसे ऑप्टिमाइज़र, हर सुविधा के लिए अलग-अलग असरदार लर्निंग रेट बनाते हैं, ताकि इस समस्या से बचा जा सके.

हमारा सुझाव है कि आप अंकों वाली एक ऐसी सुविधा को सामान्य बनाएं जिसमें एक बड़ी रेंज शामिल हो, जैसे कि &शहर की जनसंख्या." अगर आप &शहर की जनसंख्या को सामान्य नहीं कर सकते हैं, तो मॉडल को ट्रेनिंग देने पर, NN की गड़बड़ियां हो सकती हैं. माफ़ करें, Adagrad और एडम जैसे ऑप्टिमाइज़र, किसी एक सुविधा में कई तरह की वैल्यू होने पर, NaN की गड़बड़ियों को रोक नहीं सकते.