चुनौती: भारतीय पतों की क्वालिटी को समझना
भारत का पता सिस्टम, विविधता और जटिलता के लिए जाना जाता है. पते में ज़्यादा जानकारी हो सकती है. साथ ही, वे स्टैंडर्ड फ़ॉर्मैट में नहीं होते. इनमें स्थानीय लैंडमार्क शामिल होते हैं. इसके अलावा, इनमें अक्सर सटीक पिन कोड या कॉम्पोनेंट का क्रम सही नहीं होता. इससे उन लोगों, ई-कॉमर्स प्लैटफ़ॉर्म, लॉजिस्टिक्स कंपनियों, और सेवा देने वाली कंपनियों को काफ़ी मुश्किलों का सामना करना पड़ता है जो जगह की सटीक जानकारी पर निर्भर रहती हैं. भारत में पतों से जुड़ी ये समस्याएं अक्सर देखने को मिलती हैं:
- पिन कोड मौजूद नहीं हैं या गलत हैं: डाक और पैकेज को सही जगह पर पहुंचाने के लिए पिन कोड ज़रूरी होते हैं. हालांकि, अक्सर ये गलत होते हैं या मौजूद नहीं होते.
- स्पेलिंग की गड़बड़ियां: इलाकों, शहरों या राज्यों के नामों में आम तौर पर होने वाली गलतियों की वजह से, गलत जानकारी मिल सकती है.
- पते के कॉम्पोनेंट का क्रम स्टैंडर्ड के मुताबिक न होना: पते के कॉम्पोनेंट (जैसे, मकान नंबर, सड़क, इलाका, शहर) का क्रम अलग-अलग हो सकता है. इससे, पते को अपने-आप प्रोसेस करना मुश्किल हो जाता है.
- स्टैंडर्ड तरीके से जानकारी न देना: बोलचाल की भाषा में इस्तेमाल होने वाले शब्द, संक्षिप्त नाम, और जानकारी देने वाले रेफ़रंस (जैसे, "पुराने मंदिर के पास") आम तौर पर इस्तेमाल किए जाते हैं, लेकिन स्टैंडर्ड सिस्टम इन्हें नहीं समझ पाते.
- रिश्ते की जानकारी शामिल करना: पते में अक्सर "S/o" (Son of), "D/o" (Daughter of) या "C/o" (Care of) जैसे शब्द शामिल होते हैं. इससे पते में ऐसी जानकारी जुड़ जाती है जो जगह से जुड़ी नहीं होती.
- सब-परिसर के नोटेशन में अंतर: यूनिट नंबर, घर के नंबर या प्लॉट नंबर जैसे कॉम्पोनेंट (उदाहरण के लिए, "2/1") को कई तरह से लिखा जाता है. जैसे, "2/1", "2-1", "2 by 1" या "No 2, 1st part". इस वजह से, इन्हें लगातार पार्स करना मुश्किल होता है.
- उप-परिसर की जानकारी का होना: कई पतों में, खास तौर पर शहरी इलाकों में, उप-परिसर की ज़रूरी जानकारी शामिल होती है. जैसे, अपार्टमेंट नंबर, फ़्लैट नंबर या बिल्डिंग विंग की जानकारी. यह जानकारी, लास्ट-माइल डिलीवरी के लिए ज़रूरी होती है, लेकिन अक्सर यह स्ट्रक्चर्ड नहीं होती.
- अस्पष्टता: कभी-कभी पतों को कई तरह से समझा जा सकता है. इससे सटीक जगह का पता लगाने में मुश्किल होती है.
इन चुनौतियों की वजह से, डिलीवरी में समस्याएं आ सकती हैं, संचालन की लागत बढ़ सकती है, ग्राहकों को खराब अनुभव मिल सकता है, और डेटा विश्लेषण और सेवा की योजना बनाने में समस्याएं आ सकती हैं. पते की क्वालिटी के बारे में तुरंत और कार्रवाई करने लायक सुझाव पाने का कोई तरीका नहीं है.
समाधान: एआई की मदद से पते के बारे में सुझाव/राय देने या शिकायत करने की सुविधा
इन चुनौतियों को हल करने के लिए, हम जनरेटिव एआई का इस्तेमाल करके एक समाधान पेश कर रहे हैं.
इस सिस्टम को इस तरह से डिज़ाइन किया गया है कि यह भारत में रहने वाले लोगों को उनके पतों के बारे में अहम सुझाव दे सके. इससे उन्हें संभावित समस्याओं को समझने में मदद मिलती है. साथ ही, यह भी पता चलता है कि बेहतर जियोकोडिंग के नतीजों और सटीक जानकारी के लिए, पतों को बेहतर तरीके से कैसे फ़ॉर्मैट किया जा सकता है.
इसका मुख्य मकसद, Vertex AI पर Gemini मॉडल का इस्तेमाल करके ये काम करना है:
- भारत के जटिल और अक्सर गलत पतों का विश्लेषण और व्याख्या करना.
- सामान्य गड़बड़ियों और अंतरों की पहचान करना.
- मानक के मुताबिक और सही किए गए वर्शन का सुझाव दें.
- बदलावों के बारे में साफ़ तौर पर जानकारी दें.
यह सिस्टम दो फ़ॉर्म फ़ैक्टर में उपलब्ध है: - REST API - वेब यूआई
भारत में रहने वाले लोग इस टूल का इस्तेमाल कैसे कर सकते हैं
इस सुविधा का मुख्य मकसद, पते की क्वालिटी के बारे में सुझाव देना है. हालांकि, इसके और भी फ़ायदे हैं:
- बेहतर डिलीवरी: कारोबारों के लिए, पतों को बेहतर तरीके से व्यवस्थित करने का मतलब है कि डिलीवरी के कम प्रयास किए जाएंगे, परिचालन लागत कम होगी, और ग्राहकों की संतुष्टि बढ़ेगी. लोग पते को सही फ़ॉर्मैट में लिखकर, यह पक्का कर सकते हैं कि उन्हें उनके पैकेज और मेल सही तरीके से मिलें.
- डेटा को बेहतर बनाना: कंपनियां इस टूल से मिली अहम जानकारी का इस्तेमाल कर सकती हैं. इसके अलावा, वे इस टूल के एपीआई को इंटिग्रेट करके, अपने मौजूदा ग्राहक के पते के डेटाबेस को साफ़ और स्टैंडर्ड बना सकती हैं. इससे उन्हें बेहतर विश्लेषण करने और टारगेट की गई सेवाएं देने में मदद मिलेगी.
- विज़ुअल पुष्टि: दो पिन वाला मैप डिसप्ले खास तौर पर अहम होता है. उपयोगकर्ता यह देख सकते हैं कि ओरिजनल और बेहतर बनाए गए पते, एक ही जगह के हैं या अलग-अलग जगहों के. इससे यह पता लगाने में मदद मिलती है कि "साफ़ किए गए" वर्शन में, जगह की जानकारी सही तरीके से दिखाई गई है या नहीं. इसके अलावा, इससे यह भी पता चलता है कि सही जियोकोडिंग के लिए, ओरिजनल इनपुट बहुत ज़्यादा अस्पष्ट या गलत था.
उपयोगकर्ताओं को मिले सुझावों से, उन्हें अपने पतों से जुड़ी समस्याओं के बारे में पता चलता है. इससे वे समस्याओं को ठीक कर सकते हैं, अपने रिकॉर्ड अपडेट कर सकते हैं, और अपनी लोकेशन के बारे में ज़्यादा असरदार तरीके से बता सकते हैं.
यह ऐप्लिकेशन क्या है?
यह वेब ऐप्लिकेशन, एआई की मदद से काम करने वाले पते के बारे में सुझाव देने वाले सिस्टम के लिए इंटरफ़ेस के तौर पर काम करता है. इसे उपयोगकर्ताओं और कारोबारों की मदद करने के लिए डिज़ाइन किया गया है. इससे वे पतों की पुष्टि कर सकते हैं, उन्हें समझ सकते हैं, और उनमें सुधार कर सकते हैं. इसमें खास तौर पर, भारत के पतों की बारीकियों पर ध्यान दिया गया है. इस ऐप्लिकेशन में, इस्तेमाल में आसान इंटरफ़ेस उपलब्ध है. यहां उपयोगकर्ता ये काम कर सकते हैं:
- पता डालें: सीधे तौर पर टाइप करके या एक साथ कई पते चिपकाकर.
- साफ़ किया गया पता पाएं: ऐप्लिकेशन, इनपुट को प्रोसेस करता है और एआई मॉडल की समझ के आधार पर, स्टैंडर्ड और सही किया गया वर्शन उपलब्ध कराता है.
- बदलावों के बारे में जानकारी: इससे मूल पते में किए गए खास बदलावों के बारे में पता चलता है. साथ ही, सुझाव/राय देने या शिकायत करने की प्रोसेस के बारे में पारदर्शिता बनी रहती है.
- अंतर देखें: ओरिजनल और साफ़ किए गए, दोनों पतों को इंटरैक्टिव मैप पर पिन किया जाता है. इससे उपयोगकर्ता, अपनी जगहों की तुलना कर पाते हैं और एक नज़र में संभावित अंतरों की पहचान कर पाते हैं.
- पूरी जानकारी वाले कॉम्पोनेंट पाना: जियोकोड किए गए (सटीक) पते को उसके कॉम्पोनेंट (जैसे, सड़क का नंबर, इलाका, शहर, पिन कोड) के हिसाब से बांटा जाता है. इससे, पते की जानकारी को व्यवस्थित तरीके से देखा जा सकता है.
यह ऐप्लिकेशन, पते की क्वालिटी का तुरंत आकलन करने, संभावित समस्याओं को समझने, और यह देखने के लिए खास तौर पर उपयोगी है कि स्टैंडर्ड फ़ॉर्मैट पर निर्भर रहने वाले सिस्टम के लिए, पतों को बेहतर तरीके से कैसे स्ट्रक्चर किया जा सकता है.
बैकएंड आर्किटेक्चर: Gemini और Vertex AI की मदद से काम करता है
इस ऐप्लिकेशन में पतों को समझने और उन्हें बेहतर बनाने की सुविधा, Google Cloud की बेहतरीन एआई टेक्नोलॉजी की वजह से काम करती है:
- **पते की जानकारी को प्रोसेस करना: ** पते की स्ट्रिंग को पार्स करने, समझने, ठीक करने, और स्टैंडर्ड बनाने का बुनियादी काम, Google के Gemini 2.5 Flash मॉडल की मदद से किया जाता है. पता सबमिट करने पर
:
- फ़्रंटएंड ऐप्लिकेशन, इनपुट किए गए पते को बैकएंड सेवा पर भेजता है.
- यह बैकएंड सेवा, Gemini API का इस्तेमाल करती है. Gemini 2.5 Flash मॉडल को एक विस्तृत प्रॉम्प्ट दिया जाता है, ताकि वह सही और स्टैंडर्ड तरीके से प्रोसेस कर सके. मॉडल को दिए गए मुख्य निर्देश यहां दिए गए हैं:
You are an address cleaning expert. Your task is to take malformed addresses
and output cleaned and standardized versions. All addresses will be from India.
BEGIN:
Follow these instructions:
Remove any mention of "House Number," "H.No," "Door Number," "D.No,"
"Building No", "Flat No." etc. along with the number it's associated with
Remove any "C/O," "S/O," etc.
DO NOT REMOVE any name of building
It should also remove any name of person or actual house numbers etc which
appear after the texts mentioned in the previous point
Ensure there are no duplicate mentions of town names, state names, etc.
If no valid zip code is available, add an error in the Errors field:
"No valid zip code found. Please verify."
Remove mention of any Floors in the address
If there are any mention of "Near or landmark" put that in a new field called
"address_descriptors"
Expand any rd, ln, st and similar other abbreviations to road, lane, street etc.
END:
BEGIN: Structuring the output
Output the cleaned address in a single line.
Output address should put State, Country, Zip code at the end in that order.
If any critical component of the address is missing, mention that in errors section.
**Critically important:** Provide a detailed description of every change made
to the address in the "changes_made" field. Do not omit this field.
IF a House number or unit number was removed add that in a separate field
called "subpremise_details".
Output the errors in the field called "errors". If no errors, provide an empty
array.
Output all responses in JSON format.
END:
स्ट्रक्चर्ड प्रॉम्प्टिंग की मदद से, Gemini 2.5 Flash को इन कामों के लिए निर्देश दिए जाते हैं:
- जटिल और अक्सर बिना किसी स्ट्रक्चर वाले पते के इनपुट को अलग-अलग हिस्सों में बांटना.
- पते के मुख्य कॉम्पोनेंट की पहचान करना और उन्हें निकालना (जैसे, घर /फ़्लैट नंबर, बिल्डिंग का नाम, सड़क, इलाका, उप-इलाका, शहर, राज्य, पिन कोड).
- सामान्य स्पेलिंग की गलतियों और बदलावों को ठीक करना.
- कॉम्पोनेंट को भारत के हिसाब से ज़्यादा स्टैंडर्ड फ़ॉर्मैट में फिर से व्यवस्थित करें.
- जहां भी हो सके, ज़रूरी जानकारी का अनुमान लगाएं या उसे फ़्लैग करें.
"किए गए बदलावों" और किसी भी गड़बड़ी की सूची जनरेट करें, ताकि पारदर्शिता बनी रहे. अलग-अलग भाषाओं के पैटर्न और कॉन्टेक्स्ट के हिसाब से जानकारी को मैनेज करते समय, मॉडल के लिए इन निर्देशों का पालन करना ज़रूरी है. इससे अलग-अलग पते के फ़ॉर्मैट के साथ मॉडल को असरदार तरीके से काम करने में मदद मिलती है.
सर्विस देना और स्केलेबिलिटी (Vertex AI/Google Cloud पर Cloud Run): बैकएंड सेवा, Gemini API को कॉल मैनेज करती है और फ़्रंटएंड को नतीजे दिखाती है. इसे सर्वरलेस कंटेनर वाले ऐप्लिकेशन के तौर पर बनाया गया है.
इस सर्वरलेस आर्किटेक्चर में, ऐसी सेवा को डिप्लॉय करने का तरीका दिखाया गया है. डेमो ऐप्लिकेशन के तौर पर, इसका मुख्य मकसद ग्राहकों को पते की क्वालिटी के बारे में तुरंत कुछ सुझाव देना है.
आवेदन करने का तरीका
यह ऐप्लिकेशन, भारत में पते के बारे में सुझाव/राय देने या शिकायत करने वाले ऐप्लिकेशन पर उपलब्ध है.
इसका इस्तेमाल करने के लिए:
- अपना पता डालें: इनपुट फ़ील्ड में, भारत में मौजूद अपने घर का पता टाइप करें या चिपकाएं.
- पते को प्रोसेस करें: "सटीक पता" बटन पर क्लिक करें.
- नतीजों की समीक्षा करें: ऐप्लिकेशन में यह दिखेगा:
- सटीक पता.
- एक मैप, जिसमें ओरिजनल और साफ़ की गई, दोनों जगहों को दिखाया गया है.
- पते के कॉम्पोनेंट की जानकारी.
- एआई के किए गए बदलावों की सूची.
- मिली कोई भी गड़बड़ी.
एपीआई कॉल का उदाहरण (डेवलपर के लिए)
अगर डेवलपर या सिस्टम को पते की प्रोसेसिंग की सुविधा को सीधे तौर पर इंटिग्रेट करना है, तो बैकएंड सेवा को प्रोग्राम के हिसाब से कॉल किया जा सकता है.
यहां एक उदाहरण दिया गया है, जिसमें cURL
का इस्तेमाल हुआ है:
curl -X POST \
https://gemini-address-cleaner-480439120941.us-central1.run.app/clean_address \
-H "Content-Type: application/json" \
-d '{
"input_address": "S/O Laum Mirzapur Mirzapur Muzaffarpur Bihar India Mirzapur purani Darbhanga road SELAMBA BIHAR 843103"
}'
यह कमांड, JSON पेलोड में पता स्ट्रिंग के साथ POST अनुरोध भेजती है. साथ ही, यह प्रोसेस किए गए पते और अन्य काम की जानकारी वाला JSON रिस्पॉन्स दिखाती है. यह जानकारी, ऐप्लिकेशन में दिखने वाली जानकारी से मिलती-जुलती होती है.
इस ऐप्लिकेशन का मकसद, पतों को आसान बनाना है. यह सटीक और असरदार तरीके से काम करने वाला टूल उपलब्ध कराता है. खास तौर पर, भारत जैसे अलग-अलग और गतिशील माहौल में.