Praktik terbaik struktur URL untuk Google Penelusuran

Untuk memastikan Google Penelusuran dapat meng-crawl situs Anda secara efektif, gunakan struktur URL yang dapat di-crawl dan memenuhi persyaratan berikut. Jika URL Anda tidak memenuhi kriteria berikut, Google Penelusuran kemungkinan akan meng-crawl situs Anda secara tidak efisien, termasuk, tetapi tidak terbatas pada, frekuensi crawling yang sangat tinggi, atau tidak sama sekali.

Persyaratan untuk struktur URL yang dapat di-crawl

Ikuti IETF STD 66

Google Penelusuran mendukung URL seperti yang ditetapkan oleh IETF STD 66. Karakter yang ditetapkan memiliki fungsi khusus oleh standar tersebut harus berenkode persen.

Jangan gunakan fragmen URL untuk mengubah konten

Jangan gunakan fragmen untuk mengubah konten halaman, karena Google Penelusuran umumnya tidak mendukung fragmen URL. Berikut adalah contoh fragmen URL:

https://example.com/#/potatoes

Jika Anda menggunakan JavaScript untuk mengubah konten, gunakan History API sebagai gantinya.

Gunakan encoding umum untuk parameter URL

Saat menentukan parameter URL, gunakan encoding umum berikut: tanda sama dengan (=) untuk memisahkan pasangan nilai kunci dan ampersan (&) untuk menyertakan parameter tambahan. Untuk mencantumkan beberapa nilai untuk kunci yang sama dalam pasangan nilai kunci, Anda dapat menggunakan karakter apa pun yang tidak bertentangan dengan IETF STD 66, seperti koma (,).

Direkomendasikan Tidak direkomendasikan
Menggunakan tanda sama dengan (=) untuk memisahkan pasangan nilai kunci dan ampersan (&) untuk menyertakan parameter tambahan:
https://example.com/category?category=dresses&sort=low-to-high&sid=789
Menggunakan titik dua (:) untuk memisahkan pasangan nilai kunci dan tanda kurung ([ ]) untuk menyertakan parameter tambahan:
https://example.com/category?[category:dresses][sort:price-low-to-high][sid:789]
Menggunakan koma (,) untuk mencantumkan beberapa nilai untuk kunci yang sama, tanda sama dengan (=) untuk memisahkan pasangan nilai kunci, dan ampersan (&) untuk menyertakan parameter tambahan:
https://example.com/category?category=dresses&color=purple,pink,salmon&sort=low-to-high&sid=789
Menggunakan satu koma (,) untuk memisahkan pasangan nilai kunci dan koma ganda (,,) untuk menyertakan parameter tambahan:
https://example.com/category?category,dresses,,sort,lowtohigh,,sid,789

Mempermudah pemahaman struktur URL Anda

Untuk membantu Google Penelusuran (dan pengguna Anda) lebih memahami situs Anda, sebaiknya buat struktur URL yang sederhana, dengan menerapkan praktik terbaik berikut jika memungkinkan.

Praktik terbaik

Menggunakan URL deskriptif

Jika memungkinkan, gunakan kata yang dapat dibaca daripada nomor ID yang panjang di URL Anda.

Direkomendasikan (kata yang sederhana dan deskriptif) Tidak direkomendasikan (nomor ID yang panjang dan tidak dapat dibaca)
https://example.com/wiki/Aviation
https://example.com/index.php?topic=42&area=3a5ebc944f41daa6f849f730f1

Gunakan bahasa audiens Anda

Gunakan kata-kata dalam bahasa audiens Anda di URL (dan, jika berlaku, kata yang ditransliterasikan). Misalnya, jika audiens Anda melakukan penelusuran dalam bahasa Jerman, gunakan kata-kata dalam bahasa Jerman di URL:

https://example.com/lebensmittel/pfefferminz

Atau, jika audiens Anda melakukan penelusuran dalam bahasa Jepang, gunakan kata-kata dalam bahasa Jepang di URL:

https://example.com/ペパーミント

Gunakan encoding UTF-8 jika perlu

Saat menautkan ke halaman di situs Anda, gunakan encoding UTF-8 di atribut href link Anda jika perlu. Karakter ASCII tanpa fungsi khusus mungkin dibiarkan dalam bentuk yang tidak dienkode. Selain itu, karakter dalam rentang non-ASCII harus berenkode UTF-8. Contoh:

Direkomendasikan (encoding UTF-8) Tidak direkomendasikan (karakter non-ASCII)
https://example.com/%D9%86%D8%B9%D9%86%D8%A7%D8%B9/%D8%A8%D9%82%D8%A7%D9%84%D8%A9
https://example.com/نعناع
https://example.com/%E6%9D%82%E8%B4%A7/%E8%96%84%E8%8D%B7
https://example.com/杂货/薄荷
https://example.com/gem%C3%BCse
https://example.com/gemüse
https://example.com/%F0%9F%A6%99%E2%9C%A8
https://example.com/🦙✨

Gunakan tanda hubung untuk memisahkan kata

Sebaiknya pisahkan kata di URL Anda, jika memungkinkan. Secara khusus, sebaiknya gunakan tanda hubung (-), bukan garis bawah (_), untuk memisahkan kata di URL Anda, karena hal ini membantu pengguna dan mesin telusur mengidentifikasi konsep di URL dengan lebih baik. Karena alasan historis, sebaiknya jangan gunakan garis bawah, karena gaya ini sudah umum digunakan untuk menunjukkan konsep yang harus disatukan, misalnya, oleh berbagai bahasa pemrograman untuk memberi nama fungsi (seperti format_date).

Direkomendasikan Tidak direkomendasikan

Menggunakan tanda hubung (-) untuk memisahkan kata:

https://example.com/summer-clothing/filter?color-profile=dark-grey

Menggunakan garis bawah (_) untuk memisahkan kata:

https://example.com/summer_clothing/filter?color_profile=dark_grey

Menggabungkan kata dalam URL:

https://example.com/greendress

Gunakan sesedikit mungkin parameter

Jika memungkinkan, perpendek URL dengan memangkas parameter yang tidak diperlukan (yaitu, parameter yang tidak mengubah konten).

Perhatikan bahwa URL peka huruf besar/kecil

Seperti klien HTTP lainnya yang mengikuti IETF STD 66, penanganan URL Google Penelusuran peka huruf besar/kecil (misalnya, Google memperlakukan /APPLE dan /apple sebagai URL terpisah dengan kontennya masing-masing). Jika teks huruf besar dan kecil di URL diperlakukan sama oleh server web, konversikan semua teks ke format penulisan (huruf besar/kecil) yang sama sehingga Google lebih mudah memastikan bahwa URL merujuk ke halaman yang sama.

Untuk situs multi-regional

Jika situs Anda bersifat multiregional, sebaiknya gunakan struktur URL yang mempermudah penargetan-geo ke situs Anda. Untuk contoh lainnya terkait cara membuat struktur URL, lihat menggunakan URL khusus lokalitas.

Direkomendasikan (menggunakan domain khusus negara):

https://example.de

Direkomendasikan (menggunakan subdirektori khusus negara dengan gTLD):

https://example.com/de/

Menghindari masalah umum terkait URL

URL yang terlalu rumit, khususnya yang berisi beberapa parameter, dapat menyebabkan masalah bagi crawler dengan membuat banyak URL tidak penting yang mengarah ke konten identik atau mirip di situs Anda. Akibatnya, Googlebot mungkin memakai lebih banyak bandwidth dari yang semestinya, atau Google Penelusuran mungkin tidak dapat mengindeks semua konten di situs Anda sepenuhnya.

Jumlah URL yang banyak yang tidak diperlukan dapat menyebabkan sejumlah masalah. Antara lain:

Masalah umum

Pemfilteran tambahan atas kumpulan item

Banyak situs memberikan tampilan yang berbeda terkait kumpulan item atau hasil penelusuran yang sama, yang sering kali memungkinkan pengguna memfilter kumpulan ini dengan menggunakan kriteria yang ditentukan (misalnya: tunjukkan hotel di pantai kepada saya). Saat filter dapat dikombinasikan melalui penambahan (misalnya: hotel di pantai dengan pusat kebugaran), jumlah URL (tampilan data) di situs akan meluap. Membuat daftar hotel yang sedikit berbeda dalam jumlah besar adalah hal yang berlebihan karena Googlebot hanya perlu melihat sedikit daftar saja untuk menjangkau halaman bagi setiap hotel. Misalnya:

  • Properti hotel dengan "tingkat nilai":
    https://example.com/hotel-search-results.jsp?Ne=292&N=461
  • Properti hotel dengan "tingkat nilai" di pantai:
    https://example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240
  • Properti hotel dengan "tingkat nilai" di pantai dan dilengkapi pusat kebugaran:
    https://example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240+4294967270

Parameter yang tidak relevan

Parameter yang tidak relevan dalam URL dapat menyebabkan banyaknya jumlah URL, seperti:

  • Parameter rujukan:
    https://example.com/search/noheaders?click=6EE2BF1AF6A3D705D5561B7C3564D9C2&clickPage=OPD+Product+Page&cat=79
    https://example.com/discuss/showthread.php?referrerid=249406&threadid=535913
    https://example.com/products/products.asp?N=200063&Ne=500955&ref=foo%2Cbar&Cn=Accessories
  • Parameter pengurutan belanja:
    https://example.com/results?search_type=search_videos&search_query=tpb&search_sort=relevance&search_category=25
  • ID sesi:
    https://example.com/search/noheaders?sessionid=6EE2BF1AF6A3D705D5561B7C3564D9C2

Pertimbangkan menggunakan file robots.txt untuk memblokir akses Googlebot ke URL yang bermasalah ini.

Masalah kalender

Kalender yang dibuat secara dinamis dapat menghasilkan link untuk tanggal pada masa mendatang dan tanggal yang telah lalu tanpa batasan tanggal awal atau akhir. Contoh:

https://example.com/calendar.php?d=13&m=8&y=2011

Jika situs Anda memiliki kalender yang tak terbatas, tambahkan atribut nofollow untuk menghubungkan ke halaman kalender mendatang yang dibuat secara dinamis.

Menempatkan link relatif induk di halaman yang salah dapat membuat ruang tak terbatas jika server Anda tidak merespons dengan kode status HTTP yang tepat untuk halaman yang tidak ada. Misalnya, link relatif induk seperti <a href="../../category/stuff">...</a> di https://example.com/category/community/070413/html/FAQ.htm dapat mengarah ke URL palsu seperti https://example.com/category/community/category/stuff. Untuk memperbaikinya, gunakan URL relatif root di link Anda (bukan relatif induk).

Memperbaiki masalah struktur URL terkait crawling

Jika Anda mendapati Google Penelusuran meng-crawl URL bermasalah ini, sebaiknya lakukan hal berikut: