Zyskaj opinię na temat adresów w Indiach

Problem: zrozumienie jakości adresów w Indiach

Indyjski system adresowania jest znany z różnorodności i złożoności. Adresy mogą być bardzo opisowe, niestandardowe, zawierać lokalne punkty orientacyjne i często nie mają dokładnych kodów PIN ani spójnej kolejności elementów. Stanowi to poważne wyzwanie dla osób, platform e-commerce, firm logistycznych i usługodawców, którzy polegają na dokładnych danych o lokalizacji. Do najczęstszych problemów z adresami w Indiach należą:

  • Brakujące lub nieprawidłowe kody PIN: niezbędne do sprawnego przekierowywania poczty i paczek, ale często nieprawidłowe lub nieobecne.
  • Błędy ortograficzne: typowe błędy w nazwach miejscowości, miast lub stanów mogą prowadzić do błędnej interpretacji.
  • Niestandardowa kolejność komponentów: kolejność elementów adresu (np. numer domu, ulica, miejscowość, miasto) może się znacznie różnić, co utrudnia automatyczne przetwarzanie.
  • Brak standaryzacji: terminy potoczne, skróty i odniesienia opisowe (np. „w pobliżu starej świątyni”) są powszechne, ale nie są rozpoznawane przez standardowe systemy.
  • Uwzględnianie informacji o relacjach: w adresie często pojawiają się terminy takie jak „S/o” (syn), „D/o” (córka) lub „C/o” (pod opieką), które dodają dane niezwiązane z lokalizacją.
  • Różnice w notacji podrzędnych części nieruchomości: elementy takie jak numery lokali, numery domów lub numery działek (np. „2/1”) są zapisywane na wiele sposobów, np. „2/1”, „2-1”, „2 na 1” lub „nr 2, część 1”, co utrudnia ich spójne analizowanie.
  • Powszechność szczegółów dotyczących podrzędnych lokalizacji: wiele adresów, zwłaszcza w miastach, zawiera kluczowe informacje o podrzędnych lokalizacjach, takie jak numery mieszkań, numery lokali czy szczegóły dotyczące skrzydeł budynków, które są niezbędne w przypadku dostawy na ostatnim etapie, ale często nie są uporządkowane.
  • Niejednoznaczność: adresy mogą być czasami interpretowane na wiele sposobów, co prowadzi do niepewności w określeniu dokładnego punktu.

Problemy te mogą prowadzić do niepowodzeń w dostawie, wzrostu kosztów operacyjnych, pogorszenia jakości obsługi klienta oraz trudności w analizie danych i planowaniu usług. Istnieje wyraźna potrzeba uzyskiwania szybkich i przydatnych opinii na temat jakości adresu.

Rozwiązanie: opinie o adresach oparte na AI

Aby rozwiązać te problemy, przedstawiamy rozwiązanie wykorzystujące generatywną AI.

Ten system ma na celu dostarczanie użytkownikom w Indiach cennych informacji zwrotnych na temat ich adresów, aby pomóc im zrozumieć potencjalne problemy i poprawić formatowanie adresów w celu uzyskania lepszych wyników geokodowania i ogólnej dokładności.

Głównym założeniem jest używanie modeli Gemini w Vertex AI do:

  • analizować i interpretować złożone, często nieprawidłowe adresy w Indiach;
  • Identyfikuj typowe błędy i niezgodności.
  • sugerować ujednolicone i poprawione wersje;
  • wyjaśniać wprowadzane zmiany;

System jest dostępny w 2 formatach: interfejs API REST i interfejs internetowy.

Jak klienci w Indiach mogą korzystać z tego narzędzia

Głównym celem jest przekazywanie opinii na temat jakości adresów, ale korzyści są większe:

  1. Większa skuteczność dostarczania: dla firm zrozumienie, jak lepiej strukturyzować adresy, może oznaczać mniej nieudanych prób dostawy, niższe koszty operacyjne i większe zadowolenie klientów. Osoby fizyczne mogą też zwiększyć niezawodność dostarczania przesyłek i poczty, używając prawidłowo sformatowanych adresów.
  2. Ulepszanie danych: firmy mogą korzystać z informacji uzyskanych za pomocą tego narzędzia (lub zintegrować bazowy interfejs API), aby ulepszać czyszczenie i standaryzację istniejących baz danych adresów klientów, co prowadzi do lepszej analityki i bardziej precyzyjnego kierowania usług.
  3. Weryfikacja wizualna: szczególnie przydatny jest widok mapy z 2 pinezkami. Użytkownicy mogą wizualnie sprawdzić, czy oryginalny i ulepszony adres wskazują tę samą czy inną lokalizację. Pomaga to określić, czy „oczyszczona” wersja dokładnie odzwierciedla zamierzoną lokalizację, czy też pierwotne dane wejściowe były zbyt niejednoznaczne lub błędne, aby można było je prawidłowo geokodować.

Dzięki informacjom zwrotnym użytkownicy mogą poznać konkretne problemy związane z ich adresami, a następnie podjąć działania naprawcze, zaktualizować dane i skuteczniej komunikować swoje lokalizacje.

Czym jest ta aplikacja?

Ta aplikacja internetowa służy jako interfejs do systemu opinii o adresach opartego na AI. Została ona opracowana, aby pomagać użytkownikom i firmom w sprawdzaniu poprawności, zrozumieniu i ulepszaniu adresów fizycznych, ze szczególnym uwzględnieniem niuansów adresów w Indiach. Aplikacja ma przyjazny interfejs, w którym użytkownicy mogą:

  • Wpisz adres: możesz wpisać go bezpośrednio lub wkleić kilka adresów do przetwarzania zbiorczego.
  • Otrzymywanie oczyszczonego adresu: aplikacja przetwarza dane wejściowe i na podstawie modelu AI udostępnia ustandaryzowaną, poprawioną wersję.
  • Poznawanie zmian: wyróżnia konkretne modyfikacje wprowadzone w oryginalnym adresie, zapewniając przejrzystość procesu przekazywania opinii.
  • Wizualizacja różnic: zarówno oryginalne, jak i oczyszczone adresy są przypięte na interaktywnej mapie, co pozwala użytkownikom wizualnie porównać ich lokalizacje i szybko zidentyfikować potencjalne rozbieżności.
  • Uzyskiwanie szczegółowych komponentów: adres po geokodowaniu (oczyszczeniu) jest dzielony na poszczególne części (np. numer ulicy, miejscowość, miasto, kod pocztowy), co zapewnia widok strukturalny.

Ta aplikacja jest szczególnie przydatna do szybkiej oceny jakości adresu, zrozumienia potencjalnych problemów i sprawdzenia, jak można lepiej uporządkować adresy w systemach, które opierają się na standardowych formatach.

Architektura backendu: oparta na Gemini i Vertex AI

Zaawansowane technologie AI Google Cloud odpowiadają za to, że ta aplikacja potrafi rozpoznawać i ulepszać adresy:

  • **Podstawowe przetwarzanie adresów: ** podstawowe zadanie analizowania, rozumienia, poprawiania i standaryzowania ciągów znaków adresu jest wykonywane przez model Gemini 2.5 Flash od Google. Gdy adres zostanie przesłany:
    • Aplikacja frontendu wysyła adres wejściowy do usługi backendu.
    • Ta usługa backendu korzysta z Gemini API. Model Gemini 2.5 Flash otrzymuje szczegółowy prompt, aby zapewnić dokładne i standardowe przetwarzanie. Podstawowe instrukcje przekazane modelowi są następujące:
You are an address cleaning expert. Your task is to take malformed addresses
and output cleaned and standardized versions. All addresses will be from India.

BEGIN:
Follow these instructions:
Remove any mention of "House Number," "H.No," "Door Number," "D.No,"
"Building No", "Flat No." etc. along with the number it's associated with
Remove any "C/O," "S/O," etc.
DO NOT REMOVE any name of building
It should also remove any name of person or actual house numbers etc which
appear after the texts mentioned in the previous point
Ensure there are no duplicate mentions of town names, state names, etc.
If no valid zip code is available, add an error in the Errors field:
"No valid zip code found. Please verify."
Remove mention of any Floors in the address
If there are any mention of "Near or landmark" put that in a new field called
"address_descriptors"
Expand any rd, ln, st and similar other abbreviations to road, lane, street etc.
END:

BEGIN: Structuring the output
Output the cleaned address in a single line.
Output address should put State, Country, Zip code at the end in that order.
If any critical component of the address is missing, mention that in errors section.
**Critically important:** Provide a detailed description of every change made
to the address in the "changes_made" field. Do not omit this field.
IF a House number or unit number was removed add that in a separate field
called "subpremise_details".
Output the errors in the field called "errors". If no errors, provide an empty
array.
Output all responses in JSON format.
END:

Ten prompt strukturalny pomaga Gemini 2.5 Flash:

  • analizować złożone i często nieuporządkowane dane wejściowe adresu;
  • Identyfikowanie i wyodrębnianie kluczowych elementów adresu (np. numer domu /mieszkania, nazwa budynku, ulica, miejscowość, podregion, miasto, stan, kod pocztowy).
  • poprawiać typowe błędy ortograficzne i warianty pisowni;
  • Zmień kolejność komponentów na bardziej standardowy format odpowiedni dla Indii.
  • W miarę możliwości wywnioskuj lub oznacz brakujące kluczowe informacje.
  • wygenerować listę „wprowadzonych zmian” i błędów, aby zapewnić przejrzystość; Zdolność modelu do wykonywania tych szczegółowych instrukcji przy jednoczesnym uwzględnianiu różnych wzorców językowych i informacji kontekstowych ma kluczowe znaczenie dla jego skuteczności w przypadku różnych formatów adresów.

  • Obsługa i skalowalność (Cloud Run w Vertex AI/Google Cloud): usługa backendu, która koordynuje wywołania interfejsu Gemini API i zwraca wyniki do frontendu, jest zbudowana jako bezserwerowa aplikacja w kontenerze.

Ta bezserwerowa architektura pokazuje sposób wdrażania takiej usługi. Jako aplikacja demonstracyjna ma ona przede wszystkim umożliwiać klientom szybkie uzyskiwanie informacji o jakości adresów.

Jak korzystać z aplikacji

Aplikacja jest dostępna pod adresem India address feedback app (aplikacja do przesyłania opinii o adresach w Indiach).

Aby z niej skorzystać:

  1. Wpisz swój adres: wpisz lub wklej swój adres w Indiach w polu wejściowym.
  2. Przetwórz adres: kliknij przycisk „Wyczyść adres”.
  3. Sprawdź wyniki: aplikacja wyświetli:
    • Oczyszczony adres.
    • Mapa pokazująca pierwotne i oczyszczone lokalizacje.
    • podział adresu na poszczególne komponenty;
    • Lista zmian wprowadzonych przez AI.
    • Wykryte błędy.

Przykład bezpośredniego wywołania interfejsu API (dla deweloperów)

W przypadku deweloperów lub systemów, które chcą bezpośrednio zintegrować funkcję przetwarzania adresów, można programowo wywoływać usługę backendu. Oto przykład użycia właściwości cURL:

curl -X POST \
  https://gemini-address-cleaner-480439120941.us-central1.run.app/clean_address \
  -H "Content-Type: application/json" \
  -d '{
    "input_address": "S/O Laum Mirzapur Mirzapur Muzaffarpur Bihar India Mirzapur purani Darbhanga road SELAMBA BIHAR 843103"
  }'

To polecenie wysyła żądanie POST z ciągiem znaków adresu w ładunku JSON i zwraca odpowiedź JSON zawierającą przetworzony adres oraz inne istotne informacje, podobne do tych, które są wyświetlane w aplikacji.
Ta aplikacja ma na celu uproszczenie złożoności adresów, oferując cenne narzędzie do zwiększania dokładności i wydajności, zwłaszcza w różnorodnych i dynamicznych środowiskach, takich jak Indie.