Tantangan: Memahami kualitas alamat India
Sistem alamat di India dikenal karena keragaman dan kompleksitasnya. Alamat dapat sangat deskriptif, tidak standar, menyertakan landmark lokal, dan sering kali tidak memiliki kode PIN yang akurat atau urutan komponen yang konsisten. Hal ini menimbulkan tantangan yang signifikan bagi individu, platform e-commerce, perusahaan logistik, dan penyedia layanan yang mengandalkan data lokasi yang akurat. Masalah utama yang sering terjadi pada alamat India meliputi:
- Kode Pin tidak ada atau salah: Sangat penting untuk pengalihan surat dan paket yang efisien, tetapi sering kali tidak akurat atau tidak ada.
- Kesalahan ejaan: Kesalahan umum dalam nama lokalitas, kota, atau negara bagian dapat menyebabkan salah penafsiran.
- Urutan komponen non-standar: Urutan elemen alamat (seperti nomor rumah, jalan, lokalitas, kota) dapat sangat bervariasi, sehingga sulit diproses secara otomatis.
- Kurangnya standarisasi: Istilah sehari-hari, singkatan, dan referensi deskriptif (misalnya, "di dekat kuil lama") umum, tetapi tidak dipahami oleh sistem standar.
- Pencantuman informasi relasional: Istilah seperti "S/o" (Putra dari), "D/o" (Putri dari), atau "C/o" (Ditujukan kepada) sering disematkan dalam alamat, sehingga menambahkan data non-lokasi.
- Variasi dalam notasi sub-lokasi: Komponen seperti nomor unit, nomor rumah, atau nomor kavling (misalnya, "2/1") ditulis dalam berbagai cara, seperti "2/1", "2-1", "2 kali 1", atau "No 2, bagian 1", sehingga sulit diuraikan secara konsisten.
- Prevalensi detail sub-premise: Banyak alamat, terutama di area perkotaan, menyertakan informasi sub-premise penting seperti nomor apartemen, nomor flat, atau detail sayap bangunan, yang sangat penting untuk pengiriman last mile, tetapi sering kali tidak terstruktur.
- Ambiguitas: Alamat terkadang dapat ditafsirkan dalam beberapa cara, sehingga menyebabkan ketidakpastian dalam menemukan titik yang tepat.
Tantangan ini dapat menyebabkan kegagalan pengiriman, peningkatan biaya operasional, pengalaman pelanggan yang buruk, serta kesulitan dalam analisis data dan perencanaan layanan. Ada kebutuhan yang jelas akan cara untuk mendapatkan masukan yang cepat dan dapat ditindaklanjuti tentang kualitas alamat.
Solusinya: Masukan alamat yang didukung teknologi AI
Untuk mengatasi tantangan ini, kami menyajikan solusi menggunakan AI Generatif.
Sistem ini dirancang untuk memberikan masukan yang berharga kepada pengguna di India terkait alamat mereka, membantu mereka memahami potensi masalah dan cara memformatnya dengan lebih baik untuk meningkatkan hasil geocoding dan akurasi secara keseluruhan.
Ide utamanya adalah menggunakan model Gemini di Vertex AI untuk:
- Menganalisis dan menginterpretasikan alamat India yang kompleks dan sering kali salah format.
- Identifikasi kesalahan dan inkonsistensi umum.
- Menyarankan versi yang sudah distandardisasi dan dikoreksi.
- Berikan penjelasan yang jelas tentang perubahan yang dilakukan.
Sistem ini hadir dalam dua faktor bentuk: - REST API - UI web
Cara pelanggan di India dapat menggunakan alat ini
Meskipun tujuan utamanya adalah memberikan masukan tentang kualitas alamat, manfaatnya lebih luas:
- Peningkatan kualitas pengiriman: Bagi bisnis, memahami cara menyusun alamat dengan lebih baik dapat mengurangi upaya pengiriman yang gagal, mengurangi biaya operasional, dan meningkatkan kepuasan pelanggan. Individu juga dapat memastikan mereka menerima paket dan surat dengan lebih andal menggunakan alamat yang diformat dengan baik.
- Peningkatan kualitas data: Perusahaan dapat menggunakan insight yang diperoleh dari alat ini (atau mengintegrasikan API yang mendasarinya) untuk memandu pembersihan dan standarisasi database alamat pelanggan yang ada, sehingga menghasilkan analisis yang lebih baik dan layanan yang lebih tertarget.
- Verifikasi visual: Tampilan peta dengan pin ganda sangat berguna. Pengguna dapat mengonfirmasi secara visual apakah alamat asli dan yang disempurnakan mengarah ke lokasi yang sama atau berbeda. Hal ini membantu mengidentifikasi apakah versi "bersih" secara akurat mencerminkan lokasi yang dimaksud atau apakah input asli terlalu ambigu atau salah untuk geocoding yang benar.
Dengan memahami tantangan spesifik dalam alamat mereka melalui masukan yang diberikan, pengguna dapat mengambil tindakan korektif, memperbarui catatan mereka, dan mengomunikasikan lokasi mereka secara lebih efektif.
Apa aplikasi ini?
Aplikasi web ini berfungsi sebagai antarmuka ke sistem masukan alamat yang didukung AI. API ini dirancang untuk membantu pengguna dan bisnis memvalidasi, memahami, dan meningkatkan kualitas alamat fisik, dengan fokus khusus pada nuansa alamat India. Aplikasi ini menawarkan antarmuka yang mudah digunakan tempat pengguna dapat:
- Masukkan alamat: Dengan mengetiknya secara langsung atau menempelkan beberapa alamat untuk diproses secara massal.
- Menerima alamat yang sudah dibersihkan: Aplikasi memproses input dan memberikan versi yang sudah distandardisasi dan dikoreksi berdasarkan pemahaman model AI.
- Memahami perubahan: Bagian ini menyoroti modifikasi spesifik yang dilakukan pada alamat asli, sehingga memberikan transparansi dalam proses masukan.
- Memvisualisasikan perbedaan: Alamat asli dan alamat yang sudah dibersihkan disematkan di peta interaktif, sehingga pengguna dapat membandingkan lokasi mereka secara visual dan mengidentifikasi potensi perbedaan secara sekilas.
- Mendapatkan komponen terperinci: Alamat yang di-geocoding (dibersihkan) dipecah menjadi bagian-bagiannya (seperti nomor jalan, lokalitas, kota, kode pos), sehingga memberikan tampilan terstruktur.
Aplikasi ini sangat berguna untuk menilai kualitas alamat dengan cepat, memahami potensi masalah, dan melihat bagaimana alamat dapat disusun dengan lebih baik untuk sistem yang mengandalkan format standar.
Arsitektur Backend: Didukung oleh Gemini dan Vertex AI
Kecerdasan di balik kemampuan aplikasi ini untuk memahami dan menyempurnakan alamat berasal dari teknologi AI canggih Google Cloud:
- **Pemrosesan alamat inti: ** Tugas mendasar untuk
mengurai, memahami, mengoreksi, dan menstandardisasi string alamat ditangani oleh model Gemini 2.5 Flash Google. Saat alamat dikirimkan
:
- Aplikasi frontend mengirimkan alamat input ke layanan backend.
- Layanan backend ini memanfaatkan Gemini API. Model Gemini 2.5 Flash diberi perintah yang mendetail untuk memverifikasi pemrosesan yang akurat dan terstandarisasi. Petunjuk inti yang diberikan kepada model adalah sebagai berikut:
You are an address cleaning expert. Your task is to take malformed addresses
and output cleaned and standardized versions. All addresses will be from India.
BEGIN:
Follow these instructions:
Remove any mention of "House Number," "H.No," "Door Number," "D.No,"
"Building No", "Flat No." etc. along with the number it's associated with
Remove any "C/O," "S/O," etc.
DO NOT REMOVE any name of building
It should also remove any name of person or actual house numbers etc which
appear after the texts mentioned in the previous point
Ensure there are no duplicate mentions of town names, state names, etc.
If no valid zip code is available, add an error in the Errors field:
"No valid zip code found. Please verify."
Remove mention of any Floors in the address
If there are any mention of "Near or landmark" put that in a new field called
"address_descriptors"
Expand any rd, ln, st and similar other abbreviations to road, lane, street etc.
END:
BEGIN: Structuring the output
Output the cleaned address in a single line.
Output address should put State, Country, Zip code at the end in that order.
If any critical component of the address is missing, mention that in errors section.
**Critically important:** Provide a detailed description of every change made
to the address in the "changes_made" field. Do not omit this field.
IF a House number or unit number was removed add that in a separate field
called "subpremise_details".
Output the errors in the field called "errors". If no errors, provide an empty
array.
Output all responses in JSON format.
END:
Perintah terstruktur ini memandu Gemini 2.5 Flash untuk:
- Membedah input alamat yang kompleks dan sering kali tidak terstruktur.
- Mengidentifikasi dan mengekstrak komponen alamat utama (misalnya, nomor rumah /apartemen, nama gedung, jalan, lokalitas, sub-lokalitas, kota, negara bagian, kode PIN).
- Memperbaiki kesalahan ejaan dan variasinya yang umum.
- Mengatur ulang komponen ke dalam format yang lebih standar yang sesuai untuk India.
- Menyimpulkan atau menandai informasi penting yang tidak ada jika memungkinkan.
Buat daftar "perubahan yang dilakukan" dan error apa pun, sehingga memberikan transparansi. Kemampuan model untuk mengikuti petunjuk mendetail ini sambil menangani beragam pola linguistik dan informasi kontekstual adalah kunci efektivitasnya dengan berbagai format alamat.
Penayangan dan Skalabilitas (Cloud Run di Vertex AI/Google Cloud): Layanan backend yang mengatur panggilan ke Gemini API dan menampilkan hasilnya ke frontend dibangun sebagai aplikasi dalam container tanpa server.
Arsitektur serverless ini menunjukkan cara men-deploy layanan tersebut. Sebagai aplikasi demo, tujuan utamanya adalah memungkinkan pelanggan mendapatkan masukan dengan cepat tentang kualitas alamat.
Cara menggunakan aplikasi
Aplikasi ini tersedia di aplikasi masukan alamat India.
Untuk menggunakannya:
- Masukkan alamat Anda: Ketik atau tempel alamat India Anda ke dalam kolom input.
- Memproses alamat: Klik tombol "Bersihkan Alamat".
- Tinjau hasilnya: Aplikasi akan menampilkan:
- Alamat yang sudah dibersihkan.
- Peta yang menampilkan lokasi asli dan lokasi yang sudah dibersihkan.
- Rincian komponen alamat.
- Daftar perubahan yang dilakukan oleh AI.
- Error yang terdeteksi.
Contoh panggilan API langsung (untuk developer)
Untuk developer atau sistem yang ingin mengintegrasikan fungsi pemrosesan alamat secara langsung, layanan backend dapat dipanggil secara terprogram.
Berikut adalah contoh yang menggunakan cURL
:
curl -X POST \
https://gemini-address-cleaner-480439120941.us-central1.run.app/clean_address \
-H "Content-Type: application/json" \
-d '{
"input_address": "S/O Laum Mirzapur Mirzapur Muzaffarpur Bihar India Mirzapur purani Darbhanga road SELAMBA BIHAR 843103"
}'
Perintah ini mengirimkan permintaan POST dengan string alamat dalam payload JSON dan akan menampilkan respons JSON yang berisi alamat yang diproses dan informasi relevan lainnya, mirip dengan yang ditampilkan di aplikasi.
Aplikasi ini bertujuan untuk menyederhanakan kompleksitas alamat, menawarkan
alat yang berharga untuk meningkatkan akurasi dan efisiensi, terutama di lingkungan yang beragam dan
dinamis seperti India.