नीचे दिए गए विकल्पों को एक्सप्लोर करें.
अभी तक किसी भी व्यक्ति ने चेक इन नहीं किया है
कैलिफ़ोर्निया के अलग-अलग शहरों में
हाउसिंग की कीमतें.
मान लें कि आपको मकान की कीमतों का अनुमान लगाने के लिए, एक मॉडल बनाना होगा. इनमें से कौनसा विकल्प
सुविधाओं या फ़ीचर क्रॉस के कुछ सेट को समझकर
roomsPerPerson और के बीच शहर-विशिष्ट संबंध
मकान की कीमत?
तीन अलग-अलग बिन की सुविधाएं: [bined Latitude],
[बिन का देशांतर], [bined roomPerPerson]
बिनिंग अच्छी है, क्योंकि इसकी मदद से मॉडल नॉनलीनियर को सीखता है
एक सुविधा के बीच संबंध शामिल करें. हालांकि, एक शहर यहां मौजूद है
से एक से ज़्यादा डाइमेंशन हो सकते हैं. इसलिए, अलग-अलग शहरों के बीच के संबंधों को समझने में
अक्षांश और देशांतर क्रॉस करना ज़रूरी है.
एक फ़ीचर क्रॉस: [अक्षांश X देशांतर X
roomsPerPerson]
इस उदाहरण में, असल वैल्यू वाली सुविधाओं को क्रॉस करना एक अच्छा आइडिया नहीं है.
मान के वास्तविक मान को
RoomPerPerson एक सुविधा में 10% बदलाव (जैसे, अक्षांश) करते है
अन्य सुविधा में 10% बदलाव के बराबर (कहें,
रूम प्रति व्यक्ति).
एक सुविधा क्रॉस: [बाइन किया गया अक्षांश X बिन किया गया देशांतर X बिन
roomsPerPerson]
बिन किए गए अक्षांश को बिन देशांतर के साथ पार करने पर,
मॉडल का इस्तेमाल करें.
बिन करने की सुविधा, समान परिणाम उत्पन्न करने वाले अक्षांश में बदलाव को रोकती है
देशांतर में बदलाव के तौर पर दिखेगा. जानकारी के लेवल के हिसाब से
बिन के बारे में सोच रहे हैं, यह फ़ीचर क्रॉस शहर के हिसाब से सीख सकता है या
आस-पड़ोस के हिसाब से या ब्लॉक से जुड़े खास इफ़ेक्ट शामिल करने के लिए.
दो सुविधा क्रॉस: [bined Latitude X bined roomPerPerson]
और [bined देशांतर X bined roomPerPerson]
बिनिंग करना एक अच्छा आइडिया है; हालांकि, शहर अक्सर
अक्षांश और देशांतर होते हैं, इसलिए अलग-अलग सुविधा क्रॉस वजह से
शहर के हिसाब से कीमतों की जानकारी हासिल करके, एक मॉडल बनाया जा सकता है.