Le défi : comprendre la qualité des adresses en Inde
Le système d'adressage indien est connu pour sa diversité et sa complexité. Les adresses peuvent être très descriptives, non standardisées, inclure des points de repère locaux et souvent manquer de codes postaux précis ou d'un ordre cohérent des composants. Cela pose des défis importants aux particuliers, aux plates-formes de commerce électronique, aux entreprises de logistique et aux fournisseurs de services qui s'appuient sur des données de localisation précises. Voici les principaux problèmes rencontrés avec les adresses indiennes :
- Codes postaux manquants ou incorrects : ils sont essentiels pour le routage efficace du courrier et des colis, mais sont souvent inexacts ou absents.
- Fautes d'orthographe : les erreurs courantes dans les noms de localités, de villes ou d'États peuvent entraîner des erreurs d'interprétation.
- Ordre non standard des composants : la séquence des éléments d'adresse (comme le numéro de maison, la rue, la localité, la ville) peut varier considérablement, ce qui rend le traitement automatisé difficile.
- Manque de standardisation : les termes familiers, les abréviations et les références descriptives (par exemple, "près de l'ancien temple") sont courants, mais ne sont pas compris par les systèmes standards.
- Inclusion d'informations relationnelles : les termes tels que "S/o" (fils de), "D/o" (fille de) ou "C/o" (à l'attention de) sont fréquemment intégrés à l'adresse, ce qui ajoute des données non liées à la localisation.
- Variations dans les notations des sous-locaux : les composants tels que les numéros d'unité, les numéros de maison ou les numéros de parcelle (par exemple, "2/1") sont écrits de nombreuses façons, telles que "2/1", "2-1", "2 by 1" ou "No 2, 1st part", ce qui les rend difficiles à analyser de manière cohérente.
- Prévalence des détails des sous-locaux : de nombreuses adresses, en particulier dans les zones urbaines, incluent des informations essentielles sur les sous-locaux, telles que les numéros d'appartement, les numéros de logement ou les détails de l'aile du bâtiment, qui sont essentiels pour la livraison du dernier kilomètre, mais souvent non structurées.
- Ambiguïté : les adresses peuvent parfois être interprétées de plusieurs façons, ce qui entraîne une incertitude quant à la localisation exacte du point.
Ces défis peuvent entraîner des échecs de livraison, une augmentation des coûts opérationnels, une mauvaise expérience client et des difficultés dans l'analyse des données et la planification des services. Il est clairement nécessaire de disposer d'un moyen d'obtenir des commentaires rapides et exploitables sur la qualité des adresses.
La solution : commentaires sur les adresses optimisés par l'IA
Pour relever ces défis, nous présentons une solution utilisant l'IA générative.
Ce système est conçu pour fournir aux utilisateurs en Inde des commentaires utiles sur leurs adresses, en les aidant à comprendre les problèmes potentiels et à mieux les mettre en forme pour améliorer les résultats de géocodage et la précision globale.
L'idée principale est d'utiliser les modèles Gemini sur Vertex AI pour :
- analyser et interpréter des adresses indiennes complexes et souvent mal formées ;
- identifier les erreurs et les incohérences courantes ;
- suggérer des versions standardisées et corrigées ;
- fournir des explications claires sur les modifications apportées.
Le système est disponible sous deux formats : - Une API REST - Une interface utilisateur Web
Comment les clients en Inde peuvent utiliser cet outil
Bien que l'objectif principal soit de fournir des commentaires sur la qualité des adresses, les avantages vont au-delà :
- Amélioration de la délivrabilité : pour les entreprises, comprendre comment mieux structurer les adresses peut réduire le nombre de tentatives de livraison infructueuses, les coûts opérationnels et améliorer la satisfaction client. Les particuliers peuvent également s'assurer de recevoir leurs colis et leur courrier de manière plus fiable en utilisant des adresses bien mises en forme.
- Amélioration des données : les entreprises peuvent utiliser les insights obtenus grâce à cet outil (ou intégrer l'API sous-jacente) pour guider le nettoyage et la standardisation de leurs bases de données d'adresses client existantes, ce qui permet d'améliorer l'analyse et les services ciblés.
- Vérification visuelle : l'affichage de la carte à double repère est particulièrement utile. Les utilisateurs peuvent vérifier visuellement si les adresses d'origine et affinées pointent vers le même lieu ou vers des lieux différents. Cela permet de déterminer si la version "nettoyée" reflète avec précision le lieu prévu ou si l'entrée d'origine était trop ambiguë ou erronée pour un géocodage correct.
En comprenant les défis spécifiques liés à leurs adresses grâce aux commentaires fournis, les utilisateurs peuvent prendre des mesures correctives, mettre à jour leurs enregistrements et communiquer plus efficacement leurs lieux.
Qu'est-ce que cette application ?
Cette application Web sert d'interface au système de commentaires sur les adresses optimisé par l'IA. Elle est conçue pour aider les utilisateurs et les entreprises à valider, comprendre et améliorer les adresses physiques, en se concentrant particulièrement sur les nuances des adresses indiennes. L'application offre une interface conviviale où les utilisateurs peuvent :
- Saisir une adresse : en la saisissant directement ou en collant plusieurs adresses pour un traitement par lot.
- Recevoir une adresse nettoyée : l'application traite l'entrée et fournit une version standardisée et corrigée en fonction de la compréhension du modèle d'IA.
- Comprendre les modifications : elle met en évidence les modifications spécifiques apportées à l'adresse d'origine, ce qui permet de rendre le processus de commentaires transparent.
- Visualiser les différences : les adresses d'origine et nettoyées sont épinglées sur une carte interactive, ce qui permet aux utilisateurs de comparer visuellement leurs lieux et d'identifier rapidement les écarts potentiels.
- Obtenir des composants détaillés : l'adresse géocodée (nettoyée) est divisée en ses parties constitutives (comme le numéro de rue, la localité, la ville, le code postal), ce qui offre une vue structurée.
Cette application est particulièrement utile pour évaluer rapidement la qualité des adresses, comprendre les problèmes potentiels et voir comment les adresses peuvent être mieux structurées pour les systèmes qui s'appuient sur des formats standardisés.
Architecture backend : optimisée par Gemini et Vertex AI
L'intelligence qui permet à cette application de comprendre et d'affiner les adresses provient des technologies d'IA avancées de Google Cloud :
- **Traitement des adresses de base** : la tâche fondamentale d'
analyse, de compréhension, de correction et de standardisation des chaînes d'adresse est
gérée par le modèle Gemini 2.5 Flash de Google. Lorsqu'une adresse est envoyée :
- L'application frontend envoie l'adresse d'entrée à un service backend.
- Ce service backend exploite l'API Gemini. Le modèle Gemini 2.5 Flash reçoit une requête détaillée pour vérifier un traitement précis et standardisé. Les instructions de base fournies au modèle sont les suivantes :
You are an address cleaning expert. Your task is to take malformed addresses
and output cleaned and standardized versions. All addresses will be from India.
BEGIN:
Follow these instructions:
Remove any mention of "House Number," "H.No," "Door Number," "D.No,"
"Building No", "Flat No." etc. along with the number it's associated with
Remove any "C/O," "S/O," etc.
DO NOT REMOVE any name of building
It should also remove any name of person or actual house numbers etc which
appear after the texts mentioned in the previous point
Ensure there are no duplicate mentions of town names, state names, etc.
If no valid zip code is available, add an error in the Errors field:
"No valid zip code found. Please verify."
Remove mention of any Floors in the address
If there are any mention of "Near or landmark" put that in a new field called
"address_descriptors"
Expand any rd, ln, st and similar other abbreviations to road, lane, street etc.
END:
BEGIN: Structuring the output
Output the cleaned address in a single line.
Output address should put State, Country, Zip code at the end in that order.
If any critical component of the address is missing, mention that in errors section.
**Critically important:** Provide a detailed description of every change made
to the address in the "changes_made" field. Do not omit this field.
IF a House number or unit number was removed add that in a separate field
called "subpremise_details".
Output the errors in the field called "errors". If no errors, provide an empty
array.
Output all responses in JSON format.
END:
Cette requête structurée guide Gemini 2.5 Flash pour :
- analyser les entrées d'adresse complexes et souvent non structurées ;
- identifier et extraire les composants clés de l'adresse (par exemple, le numéro de maison /d'appartement, le nom du bâtiment, la rue, la localité, la sous-localité, la ville, l'État, le code postal) ;
- corriger les fautes d'orthographe et les variations courantes ;
- réorganiser les composants dans un format plus standardisé adapté à l'Inde ;
- déduire ou signaler les informations essentielles manquantes lorsque cela est possible ;
générer une liste des "modifications apportées" et des erreurs, ce qui assure la transparence. La capacité du modèle à suivre ces instructions détaillées tout en gérant différents modèles linguistiques et informations contextuelles est essentielle à son efficacité avec différents formats d'adresse.
Diffusion et évolutivité (Cloud Run sur Vertex AI/Google Cloud) : le service backend qui orchestre les appels à l'API Gemini et renvoie les résultats au frontend est conçu comme une application conteneurisée sans serveur.
Cette architecture sans serveur montre comment déployer un tel service. En tant qu'application de démonstration, son objectif principal est de permettre aux clients d'obtenir rapidement des commentaires sur la qualité des adresses.
Comment utiliser l'application
L'application est disponible sur la page Application de commentaires sur les adresses en Inde.
Pour l'utiliser :
- Saisissez votre adresse : saisissez ou collez votre adresse indienne dans le champ de saisie.
- Traitez l'adresse : cliquez sur le bouton "Clean Address" (Nettoyer l'adresse).
- Examinez les résultats : l'application affiche :
- l'adresse nettoyée ;
- une carte indiquant les lieux d'origine et nettoyés ;
- une répartition des composants de l'adresse ;
- une liste des modifications apportées par l'IA ;
- les erreurs détectées.
Exemple d'appel d'API direct (pour les développeurs)
Pour les développeurs ou les systèmes qui souhaitent intégrer directement la fonctionnalité de traitement des adresses, le service backend peut être appelé par programmation.
Voici un exemple avec cURL :
curl -X POST \
https://gemini-address-cleaner-480439120941.us-central1.run.app/clean_address \
-H "Content-Type: application/json" \
-d '{
"input_address": "S/O Laum Mirzapur Mirzapur Muzaffarpur Bihar India Mirzapur purani Darbhanga road SELAMBA BIHAR 843103"
}'
Cette commande envoie une requête POST avec la chaîne d'adresse dans une charge utile JSON et renvoie une réponse JSON contenant l'adresse traitée et d'autres informations pertinentes, semblables à celles affichées dans l'application.
Cette application vise à simplifier la complexité des adresses, en offrant un outil précieux pour améliorer la précision et l'efficacité, en particulier dans des environnements diversifiés et dynamiques comme l'Inde.