インドの住所に関するフィードバックを取得する

課題: インドの住所の品質を理解する

インドの住所システムは、多様性と複雑さで知られています。住所は、非常に説明的で、標準化されておらず、地域のランドマークが含まれている場合があり、正確な郵便番号や一貫した構成要素の順序が欠けていることがよくあります。これは、正確な位置情報に依存する個人、e コマース プラットフォーム、物流会社、サービス プロバイダにとって大きな課題となります。インドの住所でよく発生する主な問題は次のとおりです。

  • 郵便番号が正しくない、または記載されていない: 郵便物や荷物の効率的な配送に不可欠ですが、不正確な場合や記載されていない場合がよくあります。
  • スペルミス: 地域、都市、州の名前の一般的な間違いは、誤解につながる可能性があります。
  • 標準外のコンポーネントの順序: 住所要素(番地、通り、地域、市区町村など)の順序は大きく異なるため、自動処理が困難になります。
  • 標準化の欠如: 口語表現、略語、説明的な参照(「古い寺の近く」など)は一般的ですが、標準システムでは理解されません。
  • 関係情報の包含: 「S/o」(Son of)、「D/o」(Daughter of)、「C/o」(Care of)などの用語が住所に頻繁に埋め込まれ、位置情報以外のデータが追加されます。
  • 建物内の表記のバリエーション: ユニット番号、住居番号、区画番号などのコンポーネント(例: 「2/1」などのスコアは、「2/1」、「2-1」、「2 by 1」、「No 2, 1st part」など、さまざまな方法で記述されるため、一貫して解析することが困難です。
  • サブプレミス情報の普及: 多くの住所、特に都市部では、アパート番号、フラット番号、建物の棟などの重要なサブプレミス情報が含まれています。これらの情報はラストワンマイルの配送に不可欠ですが、構造化されていないことがよくあります。
  • 曖昧さ: 住所は複数の方法で解釈されることがあり、正確な場所を特定する際に不確実性が生じることがあります。

これらの課題は、配信の失敗、運用コストの増加、顧客体験の低下、データ分析とサービス計画の困難につながる可能性があります。住所の品質に関する迅速で実用的なフィードバックを得る方法が明らかに必要とされています。

解決策: AI を活用した住所のフィードバック

これらの課題に対処するため、生成 AI を使用したソリューションを紹介します。

このシステムは、インドのユーザーに住所に関する貴重なフィードバックを提供し、潜在的な問題と、ジオコーディングの結果と全体的な精度を向上させるための住所の形式設定方法を理解できるように設計されています。

基本的な考え方は、Vertex AI で Gemini モデルを使用して次のことを行うことです。

  • 複雑で形式が正しくないことが多いインドの住所を分析して解釈します。
  • 一般的なエラーや不整合を特定します。
  • 標準化された修正版を提案します。
  • 変更内容を明確に説明します。

このシステムには、REST API とウェブ UI の 2 つのフォーム ファクタがあります。

インドのお客様がこのツールを使用する方法

主な目的は住所の品質に関するフィードバックを提供することですが、次のようなメリットもあります。

  1. 配達可能性の向上: 住所の構造をより適切に理解することで、配達の失敗を減らし、運用コストを削減し、顧客満足度を高めることができます。また、住所を正しく入力することで、荷物や郵便物をより確実に受け取ることができます。
  2. データ拡張: 企業は、このツールから得られた分析情報を使用して(または基盤となる API を統合して)、既存の顧客住所データベースのクリーニングと標準化をガイドし、分析の改善とターゲット サービスを実現できます。
  3. 視覚的な確認: デュアルピンの地図表示は特に便利です。元の住所と修正後の住所が同じ場所を指しているか、異なる場所を指しているかを視覚的に確認できます。これにより、「クリーンアップ」されたバージョンが意図した場所を正確に反映しているかどうか、または元の入力が正確なジオコーディングを行うには曖昧すぎるか誤りがあるかどうかを特定できます。

ユーザーは、提供されたフィードバックを通じて住所の具体的な問題を把握し、修正措置を講じて記録を更新し、位置情報をより効果的に伝えることができます。

このアプリケーションは何ですか?

このウェブ アプリケーションは、AI を活用した住所フィードバック システムのインターフェースとして機能します。この API は、ユーザーと企業が住所を検証、理解、改善できるように設計されています。特に、インドの住所のニュアンスに重点を置いています。このアプリケーションは、ユーザーが次の操作を行えるユーザー フレンドリーなインターフェースを備えています。

  • 住所を入力する: 住所を直接入力するか、複数の住所を貼り付けて一括処理します。
  • クリーンアップされた住所を受け取る: アプリケーションは入力を処理し、AI モデルの理解に基づいて標準化された修正版を提供します。
  • 変更内容を把握する: 元のアドレスに加えられた具体的な変更がハイライト表示され、フィードバック プロセスの透明性が高まります。
  • 相違点を可視化する: 元の住所とクリーンアップされた住所の両方がインタラクティブな地図にピン留めされるため、ユーザーは位置を視覚的に比較し、潜在的な不一致を一目で特定できます。
  • 詳細なコンポーネントを取得する: ジオコード化(クリーンアップ)された住所が、構成要素(番地、地域、市区町村、郵便番号など)に分解され、構造化されたビューが提供されます。

このアプリは、住所の品質をすばやく評価し、潜在的な問題を把握し、標準化された形式に依存するシステムで住所をより適切に構造化する方法を確認するのに特に便利です。

バックエンド アーキテクチャ: Gemini と Vertex AI を活用

このアプリケーションが住所を理解して絞り込むことができるのは、Google Cloud の高度な AI テクノロジーによるものです。

  • **コア アドレス処理: ** アドレス文字列の解析、理解、修正、標準化という基本的なタスクは、Google の Gemini 2.5 Flash モデルによって処理されます。住所が送信された場合:
    • フロントエンド アプリケーションは、入力された住所をバックエンド サービスに送信します。
    • このバックエンド サービスは Gemini API を活用します。Gemini 2.5 Flash モデルには、正確で標準化された処理を検証するための詳細なプロンプトが指示されます。モデルに与えられるコア指示は次のとおりです。
You are an address cleaning expert. Your task is to take malformed addresses
and output cleaned and standardized versions. All addresses will be from India.

BEGIN:
Follow these instructions:
Remove any mention of "House Number," "H.No," "Door Number," "D.No,"
"Building No", "Flat No." etc. along with the number it's associated with
Remove any "C/O," "S/O," etc.
DO NOT REMOVE any name of building
It should also remove any name of person or actual house numbers etc which
appear after the texts mentioned in the previous point
Ensure there are no duplicate mentions of town names, state names, etc.
If no valid zip code is available, add an error in the Errors field:
"No valid zip code found. Please verify."
Remove mention of any Floors in the address
If there are any mention of "Near or landmark" put that in a new field called
"address_descriptors"
Expand any rd, ln, st and similar other abbreviations to road, lane, street etc.
END:

BEGIN: Structuring the output
Output the cleaned address in a single line.
Output address should put State, Country, Zip code at the end in that order.
If any critical component of the address is missing, mention that in errors section.
**Critically important:** Provide a detailed description of every change made
to the address in the "changes_made" field. Do not omit this field.
IF a House number or unit number was removed add that in a separate field
called "subpremise_details".
Output the errors in the field called "errors". If no errors, provide an empty
array.
Output all responses in JSON format.
END:

この構造化されたプロンプトは、Gemini 2.5 Flash に次の処理を行うよう指示します。

  • 複雑で構造化されていないことが多い住所入力を解析します。
  • 主要な住所コンポーネント(家屋番号、建物名、番地、地域区分、小地域区分、市区郡、都道府県、郵便番号)。
  • よくあるスペルミスや表記のバリエーションを修正します。
  • インドに適したより標準化された形式にコンポーネントを並べ替えます。
  • 可能な場合は、重要な情報が不足していることを推測またはフラグ設定します。
  • 「変更内容」とエラーのリストを生成し、透明性を確保します。さまざまな言語パターンとコンテキスト情報を処理しながら、これらの詳細な手順に沿って処理できることが、さまざまな住所形式で効果を発揮する鍵となります。

  • サービングとスケーラビリティ(Vertex AI/Google Cloud の Cloud Run): Gemini API への呼び出しをオーケストレートし、結果をフロントエンドに返すバックエンド サービスは、サーバーレスのコンテナ化されたアプリケーションとして構築されます。

このサーバーレス アーキテクチャは、このようなサービスをデプロイする方法を示しています。デモ アプリケーションとしての主な目的は、お客様が住所の品質に関するフィードバックを迅速に取得できるようにすることです。

アプリケーションの使用方法

このアプリは、インドの住所に関するフィードバック アプリでご利用いただけます。

使用方法は次のとおりです。

  1. 住所を入力する: インドの住所を入力欄に入力するか貼り付けます。
  2. 住所を処理する: [Clean Address] ボタンをクリックします。
  3. 結果を確認します。アプリケーションに次の内容が表示されます。
    • クリーンアップされた住所。
    • 元の場所とクリーンアップされた場所の両方を示す地図。
    • 住所コンポーネントの内訳。
    • AI によって行われた変更のリスト。
    • 検出されたエラー。

直接 API 呼び出しの例(デベロッパー向け)

アドレス処理機能を直接統合しようとしているデベロッパーやシステムの場合、バックエンド サービスをプログラムで呼び出すことができます。以下に cURL を使用した例を示します。

curl -X POST \
  https://gemini-address-cleaner-480439120941.us-central1.run.app/clean_address \
  -H "Content-Type: application/json" \
  -d '{
    "input_address": "S/O Laum Mirzapur Mirzapur Muzaffarpur Bihar India Mirzapur purani Darbhanga road SELAMBA BIHAR 843103"
  }'

このコマンドは、JSON ペイロードに住所文字列を含む POST リクエストを送信し、処理された住所やその他の関連情報を含む JSON レスポンスを返します。これは、アプリケーションに表示されるものと似ています。
このアプリケーションは、住所の複雑さを簡素化することを目的としており、特にインドのような多様で動的な環境において、精度と効率を高めるための貴重なツールとなります。