Obtenir des commentaires sur les adresses indiennes

Le défi : comprendre la qualité des adresses indiennes

Le système d'adressage de l'Inde est connu pour sa diversité et sa complexité. Les adresses peuvent être très descriptives, non standardisées, inclure des points de repère locaux et souvent manquer de codes postaux précis ou d'un ordre de composants cohérent. Cela pose des problèmes importants pour les particuliers, les plates-formes d'e-commerce, les entreprises de logistique et les fournisseurs de services qui s'appuient sur des données de localisation précises. Voici les principaux problèmes souvent rencontrés avec les adresses indiennes :

  • Codes postaux manquants ou incorrects : ils sont essentiels pour acheminer efficacement le courrier et les colis, mais ils sont souvent inexacts ou absents.
  • Fautes d'orthographe : les erreurs courantes dans les noms de localités, de villes ou d'États peuvent entraîner des erreurs d'interprétation.
  • Ordre non standard des composants : l'ordre des éléments d'adresse (comme le numéro de maison, la rue, la localité, la ville) peut varier considérablement, ce qui rend le traitement automatisé difficile.
  • Manque de normalisation : les termes familiers, les abréviations et les références descriptives (par exemple, "près de l'ancien temple") sont courants, mais ne sont pas compris par les systèmes standards.
  • Inclusion d'informations relationnelles : des termes tels que "Fils de", "Fille de" ou "Au soin de" sont souvent intégrés à l'adresse, ajoutant des données non liées à la localisation.
  • Variations dans les notations de sous-établissements : les composants tels que les numéros d'unité, les numéros de maison ou les numéros de parcelle (par exemple, "2/1") sont écrits de nombreuses façons, par exemple "2/1", "2-1", "2 par 1" ou "N° 2, 1re partie", ce qui les rend difficiles à analyser de manière cohérente.
  • Fréquence des informations de niveau inférieur : de nombreuses adresses, en particulier dans les zones urbaines, incluent des informations de niveau inférieur essentielles telles que les numéros d'appartement, de logement ou d'aile du bâtiment, qui sont essentielles pour la livraison du dernier kilomètre, mais souvent non structurées.
  • Ambiguïté : les adresses peuvent parfois être interprétées de plusieurs façons, ce qui entraîne une incertitude quant à la localisation du point exact.

Ces difficultés peuvent entraîner des échecs de livraison, une augmentation des coûts opérationnels, une mauvaise expérience client et des difficultés dans l'analyse des données et la planification des services. Il est clairement nécessaire de pouvoir obtenir rapidement des commentaires exploitables sur la qualité des adresses.

La solution : des commentaires sur les adresses optimisés par l'IA

Pour relever ces défis, nous vous proposons une solution utilisant l'IA générative.

Ce système est conçu pour fournir aux utilisateurs en Inde des commentaires utiles sur leurs adresses. Il les aide à comprendre les problèmes potentiels et à mieux les mettre en forme pour améliorer les résultats du géocodage et la précision globale.

L'idée principale est d'utiliser les modèles Gemini sur Vertex AI pour :

  • Analyser et interpréter des adresses indiennes complexes, souvent mal formées.
  • Identifier les erreurs et les incohérences courantes.
  • suggérer des versions standardisées et corrigées ;
  • Fournissez des explications claires sur les modifications apportées.

Le système se présente sous deux formes : - Une API REST - Une UI Web

Comment les clients en Inde peuvent utiliser cet outil

Bien que l'objectif principal soit de fournir des commentaires sur la qualité des adresses, les avantages vont au-delà :

  1. Amélioration de la distribution : pour les entreprises, comprendre comment mieux structurer les adresses peut réduire le nombre de tentatives de distribution infructueuses, les coûts opérationnels et améliorer la satisfaction client. Les particuliers peuvent également s'assurer de recevoir leurs colis et leur courrier de manière plus fiable en utilisant des adresses bien formatées.
  2. Amélioration des données : les entreprises peuvent utiliser les insights obtenus grâce à cet outil (ou intégrer l'API sous-jacente) pour guider le nettoyage et la standardisation de leurs bases de données d'adresses client existantes, ce qui permet d'améliorer les analyses et les services ciblés.
  3. Vérification visuelle : l'affichage de la carte à double repère est particulièrement utile. Les utilisateurs peuvent vérifier visuellement si les adresses d'origine et affinées pointent vers le même lieu ou vers des lieux différents. Cela permet de déterminer si la version "nettoyée" reflète précisément l'emplacement prévu ou si la saisie d'origine était trop ambiguë ou erronée pour un géocodage correct.

En comprenant les problèmes spécifiques liés à leurs adresses grâce aux commentaires fournis, les utilisateurs peuvent prendre des mesures correctives, mettre à jour leurs informations et communiquer plus efficacement leurs positions.

Qu'est-ce que cette application ?

Cette application Web sert d'interface au système de commentaires sur les adresses optimisé par l'IA. Il est conçu pour aider les utilisateurs et les entreprises à valider, comprendre et améliorer les adresses physiques, en se concentrant particulièrement sur les nuances des adresses indiennes. L'application propose une interface conviviale permettant aux utilisateurs de :

  • Saisissez une adresse : saisissez-la directement ou collez plusieurs adresses pour les traiter par lot.
  • Recevoir une adresse nettoyée : l'application traite l'entrée et fournit une version standardisée et corrigée en fonction de la compréhension du modèle d'IA.
  • Comprendre les modifications : les modifications spécifiques apportées à l'adresse d'origine sont mises en évidence, ce qui permet de comprendre le processus de commentaires.
  • Visualiser les différences : les adresses d'origine et nettoyées sont épinglées sur une carte interactive, ce qui permet aux utilisateurs de comparer visuellement leurs emplacements et d'identifier rapidement les éventuelles incohérences.
  • Obtenir des composants détaillés : l'adresse géocodée (nettoyée) est décomposée en ses parties constituantes (comme le numéro de rue, la localité, la ville, le code postal), ce qui permet d'obtenir une vue structurée.

Cette application est particulièrement utile pour évaluer rapidement la qualité des adresses, comprendre les problèmes potentiels et voir comment les adresses pourraient être mieux structurées pour les systèmes qui reposent sur des formats standardisés.

Architecture du backend : optimisée par Gemini et Vertex AI

L'intelligence qui permet à cette application de comprendre et d'affiner les adresses provient des technologies d'IA avancées de Google Cloud :

  • **Traitement des adresses de base** : la tâche fondamentale d'analyse, de compréhension, de correction et de normalisation des chaînes d'adresses est gérée par le modèle Gemini 2.5 Flash de Google. Lorsqu'une adresse est envoyée :
    • L'application d'interface envoie l'adresse saisie à un service de backend.
    • Ce service de backend utilise l'API Gemini. Le modèle Gemini 2.5 Flash reçoit une requête détaillée pour vérifier que le traitement est précis et standardisé. Les instructions de base données au modèle sont les suivantes :
You are an address cleaning expert. Your task is to take malformed addresses
and output cleaned and standardized versions. All addresses will be from India.

BEGIN:
Follow these instructions:
Remove any mention of "House Number," "H.No," "Door Number," "D.No,"
"Building No", "Flat No." etc. along with the number it's associated with
Remove any "C/O," "S/O," etc.
DO NOT REMOVE any name of building
It should also remove any name of person or actual house numbers etc which
appear after the texts mentioned in the previous point
Ensure there are no duplicate mentions of town names, state names, etc.
If no valid zip code is available, add an error in the Errors field:
"No valid zip code found. Please verify."
Remove mention of any Floors in the address
If there are any mention of "Near or landmark" put that in a new field called
"address_descriptors"
Expand any rd, ln, st and similar other abbreviations to road, lane, street etc.
END:

BEGIN: Structuring the output
Output the cleaned address in a single line.
Output address should put State, Country, Zip code at the end in that order.
If any critical component of the address is missing, mention that in errors section.
**Critically important:** Provide a detailed description of every change made
to the address in the "changes_made" field. Do not omit this field.
IF a House number or unit number was removed add that in a separate field
called "subpremise_details".
Output the errors in the field called "errors". If no errors, provide an empty
array.
Output all responses in JSON format.
END:

Cette requête structurée guide Gemini 2.5 Flash pour :

  • Analyser des entrées d'adresse complexes et souvent non structurées.
  • Identifier et extraire les composants clés d'une adresse (par exemple, numéro de maison /d'appartement, nom du bâtiment, rue, localité, sous-localité, ville, état, code postal).
  • Corrigez les fautes d'orthographe et les variantes courantes.
  • Réorganiser les composants dans un format plus standardisé adapté à l'Inde.
  • Déduisez ou signalez les informations essentielles manquantes, si possible.
  • Générer une liste des "modifications apportées" et des éventuelles erreurs, pour plus de transparence. La capacité du modèle à suivre ces instructions détaillées tout en gérant divers schémas linguistiques et informations contextuelles est essentielle à son efficacité avec différents formats d'adresses.

  • Diffusion et évolutivité (Cloud Run sur Vertex AI/Google Cloud) : le service de backend qui orchestre les appels à l'API Gemini et renvoie les résultats au frontend est conçu comme une application conteneurisée sans serveur.

Cette architecture sans serveur montre comment déployer un tel service. En tant qu'application de démonstration, son objectif principal est de permettre aux clients d'obtenir rapidement des informations sur la qualité des adresses.

Utiliser l'application

L'application est disponible sur India address feedback app.

Pour l'utiliser :

  1. Saisissez votre adresse : saisissez ou collez votre adresse indienne dans le champ de saisie.
  2. Traitez l'adresse : cliquez sur le bouton "Nettoyer l'adresse".
  3. Examinez les résultats : l'application affichera :
    • Adresse nettoyée.
    • Carte montrant les emplacements d'origine et nettoyés.
    • Décomposition des composants de l'adresse.
    • Liste des modifications apportées par l'IA.
    • Toutes les erreurs détectées.

Exemple d'appel d'API direct (pour les développeurs)

Pour les développeurs ou les systèmes qui souhaitent intégrer directement la fonctionnalité de traitement des adresses, le service de backend peut être appelé de manière programmatique. Voici un exemple avec cURL :

curl -X POST \
  https://gemini-address-cleaner-480439120941.us-central1.run.app/clean_address \
  -H "Content-Type: application/json" \
  -d '{
    "input_address": "S/O Laum Mirzapur Mirzapur Muzaffarpur Bihar India Mirzapur purani Darbhanga road SELAMBA BIHAR 843103"
  }'

Cette commande envoie une requête POST avec la chaîne d'adresse dans une charge utile JSON et renvoie une réponse JSON contenant l'adresse traitée et d'autres informations pertinentes, semblables à celles affichées dans l'application.
Cette application vise à simplifier la complexité des adresses, en offrant un outil précieux pour améliorer la précision et l'efficacité, en particulier dans des environnements diversifiés et dynamiques comme l'Inde.