Получите отзыв об индийских адресах,Получите отзыв об индийских адресах

Задача: понять качество индийских адресов

Система адресации в Индии известна своим разнообразием и сложностью. Адреса могут быть слишком описательными, нестандартными, включать местные достопримечательности и часто не иметь точных PIN-кодов или единого порядка компонентов. Это создаёт серьёзные проблемы для частных лиц, платформ электронной коммерции, логистических компаний и поставщиков услуг, которым необходимы точные данные о местоположении. Основные проблемы, часто возникающие при использовании индийских адресов, включают:

  • Отсутствующие или неверные пин-коды: необходимы для эффективной маршрутизации почты и посылок, но часто неточны или отсутствуют.
  • Орфографические ошибки: Распространенные ошибки в названиях населенных пунктов, городов или штатов могут привести к неправильной интерпретации.
  • Нестандартный порядок компонентов: последовательность элементов адреса (например, номер дома, улица, населенный пункт, город) может значительно различаться, что затрудняет автоматическую обработку.
  • Отсутствие стандартизации: разговорные термины, сокращения и описательные ссылки (например, «возле старого храма») широко распространены, но не понимаются стандартными системами.
  • Включение информации о местоположении: такие термины, как «S/o» (сын), «D/o» (дочь) или «C/o» (опекун), часто включаются в адрес, добавляя нелокальные данные.
  • Вариации в обозначениях подпомещений: такие компоненты, как номера квартир, домов или участков (например, «2/1»), записываются по-разному, например, «2/1», «2-1», «2 по 1» или «№ 2, 1-я часть», что затрудняет их последовательный анализ.
  • Распространенность дополнительных сведений: многие адреса, особенно в городских районах, включают важную дополнительную информацию, например, номера квартир, номера этажей или сведения о крыльях здания, которые имеют решающее значение для доставки «последней мили», но часто неструктурированы.
  • Неоднозначность: адреса иногда можно интерпретировать по-разному, что приводит к неопределенности в определении точного местоположения.

Эти проблемы могут привести к сбоям в доставке, увеличению эксплуатационных расходов, ухудшению качества обслуживания клиентов и трудностям с анализом данных и планированием услуг. Существует очевидная потребность в способе получения быстрой и действенной обратной связи о качестве адресов.

Решение: обратная связь по адресу на основе искусственного интеллекта

Для решения этих проблем мы представляем решение с использованием генеративного ИИ.

Эта система предназначена для предоставления пользователям в Индии ценной обратной связи по их адресам, помогая им понять потенциальные проблемы и как лучше их форматировать для улучшения результатов геокодирования и общей точности.

Основная идея заключается в использовании моделей Gemini на Vertex AI для:

  • Анализируйте и интерпретируйте сложные, часто искаженные, индийские адреса.
  • Выявите типичные ошибки и несоответствия.
  • Предложите стандартизированные и исправленные версии.
  • Дайте четкие объяснения внесенным изменениям.

Система доступна в двух форм-факторах: - REST API - Веб-интерфейс

Как клиенты в Индии могут использовать этот инструмент

Хотя основная цель заключается в предоставлении отзывов о качестве адреса, преимущества выходят за рамки этого:

  1. Повышение доступности: для компаний понимание того, как лучше структурировать адреса, может означать меньше неудачных попыток доставки, снижение операционных расходов и повышение удовлетворенности клиентов. Частные лица также могут быть уверены в более надежной доставке своих посылок и корреспонденции, используя правильно отформатированные адреса.
  2. Улучшение данных: компании могут использовать информацию, полученную с помощью этого инструмента (или интегрировать базовый API), для очистки и стандартизации существующих баз данных адресов клиентов, что приведет к улучшению аналитики и предоставлению целевых услуг.
  3. Визуальная проверка: отображение карты с двумя точками особенно ценно. Пользователи могут визуально проверить, указывают ли исходный и уточнённый адреса на одно и то же или на разные места. Это помогает определить, точно ли «очищенная» версия отражает предполагаемое местоположение или исходные данные были слишком неоднозначными или ошибочными для корректного геокодирования.

Понимая конкретные проблемы в своих адресах с помощью предоставленной обратной связи, пользователи могут предпринять корректирующие действия, обновить свои записи и более эффективно сообщать свое местоположение.

Что это за приложение?

Это веб-приложение служит интерфейсом к системе обратной связи по адресам на базе искусственного интеллекта. Оно разработано, чтобы помочь пользователям и компаниям проверять, понимать и улучшать физические адреса, уделяя особое внимание особенностям индийских адресов. Приложение предлагает удобный интерфейс, позволяющий пользователям:

  • Введите адрес: либо набрав его напрямую, либо вставив несколько адресов для массовой обработки.
  • Получение очищенного адреса: приложение обрабатывает входные данные и предоставляет стандартизированную, исправленную версию на основе понимания модели ИИ.
  • Понимание изменений: он выделяет конкретные изменения, внесенные в исходный адрес, обеспечивая прозрачность процесса обратной связи.
  • Визуализация различий: как исходный, так и очищенный адреса закрепляются на интерактивной карте, что позволяет пользователям визуально сравнивать их местоположения и сразу выявлять потенциальные несоответствия.
  • Получите подробные компоненты: геокодированный (очищенный) адрес разбивается на составные части (например, номер дома, населенный пункт, город, почтовый индекс), обеспечивая структурированное представление.

Это приложение особенно полезно для быстрой оценки качества адреса, понимания потенциальных проблем и просмотра того, как можно лучше структурировать адреса для систем, использующих стандартизированные форматы.

Архитектура бэкэнда: на базе Gemini и Vertex AI

Интеллектуальная способность этого приложения распознавать и уточнять адреса основана на передовых технологиях искусственного интеллекта Google Cloud:

  • **Основная обработка адресов:** Основную задачу анализа, понимания, исправления и стандартизации строк адресов выполняет модель Google Gemini 2.5 Flash . При отправке адреса:
    • Приложение frontend отправляет входной адрес службе backend.
    • Этот бэкэнд-сервис использует API Gemini. Модель Gemini 2.5 Flash получает подробные инструкции для проверки точности и стандартизации обработки. Основные инструкции, предоставляемые модели, следующие:
You are an address cleaning expert. Your task is to take malformed addresses
and output cleaned and standardized versions. All addresses will be from India.

BEGIN:
Follow these instructions:
Remove any mention of "House Number," "H.No," "Door Number," "D.No,"
"Building No", "Flat No." etc. along with the number it's associated with
Remove any "C/O," "S/O," etc.
DO NOT REMOVE any name of building
It should also remove any name of person or actual house numbers etc which
appear after the texts mentioned in the previous point
Ensure there are no duplicate mentions of town names, state names, etc.
If no valid zip code is available, add an error in the Errors field:
"No valid zip code found. Please verify."
Remove mention of any Floors in the address
If there are any mention of "Near or landmark" put that in a new field called
"address_descriptors"
Expand any rd, ln, st and similar other abbreviations to road, lane, street etc.
END:

BEGIN: Structuring the output
Output the cleaned address in a single line.
Output address should put State, Country, Zip code at the end in that order.
If any critical component of the address is missing, mention that in errors section.
**Critically important:** Provide a detailed description of every change made
to the address in the "changes_made" field. Do not omit this field.
IF a House number or unit number was removed add that in a separate field
called "subpremise_details".
Output the errors in the field called "errors". If no errors, provide an empty
array.
Output all responses in JSON format.
END:

Эти структурированные подсказки помогут Gemini 2.5 Flash:

  • Анализируйте сложные и часто неструктурированные адресные данные.
  • Определите и извлеките ключевые компоненты адреса (например, номер дома/квартиры, название здания, улица, населенный пункт, микрорайон, город, штат, PIN-код).
  • Исправьте распространённые орфографические ошибки и вариации.
  • Переупорядочить компоненты в более стандартизированный формат, подходящий для Индии.
  • По возможности выведите или отметьте недостающую важную информацию.
  • Создайте список «внесённых изменений» и любых ошибок, обеспечив прозрачность. Способность модели следовать этим подробным инструкциям, обрабатывая разнообразные языковые шаблоны и контекстную информацию, является ключом к её эффективности при работе с различными форматами адресов.

  • Обслуживание и масштабируемость (облачная работа на базе Vertex AI/Google Cloud): внутренняя служба, которая координирует вызовы API Gemini и возвращает результаты на внешний интерфейс, построена как бессерверное контейнерное приложение.

Эта бессерверная архитектура демонстрирует способ развертывания такой службы. Поскольку это демонстрационное приложение, его основная цель — предоставить клиентам возможность быстро получить обратную связь о качестве адресов.

Как пользоваться приложением

Приложение доступно в Индии в качестве приложения для обратной связи по адресу .

Чтобы использовать его:

  1. Введите свой адрес: введите или вставьте свой индийский адрес в поле ввода.
  2. Обработайте адрес: нажмите кнопку «Очистить адрес».
  3. Просмотрите результаты: Приложение отобразит:
    • Очищенный адрес.
    • Карта, на которой показаны как первоначальные, так и очищенные места.
    • Разбивка компонентов адреса.
    • Список изменений, внесенных ИИ.
    • Обнаружены любые ошибки.

Пример прямого вызова API (для разработчиков)

Для разработчиков или систем, желающих напрямую интегрировать функцию обработки адресов, можно вызвать внутреннюю службу программно. Вот пример использования cURL :

curl -X POST \
  https://gemini-address-cleaner-480439120941.us-central1.run.app/clean_address \
  -H "Content-Type: application/json" \
  -d '{
    "input_address": "S/O Laum Mirzapur Mirzapur Muzaffarpur Bihar India Mirzapur purani Darbhanga road SELAMBA BIHAR 843103"
  }'

Эта команда отправляет запрос POST со строкой адреса в полезной нагрузке JSON и возвращает ответ JSON, содержащий обработанный адрес и другую соответствующую информацию, аналогичную той, что отображается в приложении.
Это приложение направлено на упрощение сложной адресной информации, предлагая ценный инструмент для повышения точности и эффективности, особенно в таких разнообразных и динамичных средах, как Индия.