Menjaga kesederhanaan struktur URL

Struktur URL situs harus dibuat sesederhana mungkin. Pertimbangkan untuk mengelola konten Anda agar URL dapat disusun secara logis dan dengan cara yang paling dapat dipahami oleh pengguna (jika memungkinkan, dengan kata yang dapat dibaca daripada nomor ID yang panjang). Misalnya, jika Anda menelusuri informasi mengenai penerbangan, URL berikut dapat membantu Anda memutuskan apakah Anda akan mengklik link tersebut atau tidak:

http://en.wikipedia.org/wiki/Aviation

URL berikut kurang menarik bagi pengguna:

http://www.example.com/index.php?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1

Pertimbangkan untuk menggunakan tanda baca di URL Anda. URL http://www.example.com/green-dress.html jauh lebih berguna bagi kami daripada http://www.example.com/greendress.html. Kami menyarankan agar Anda menggunakan tanda hubung -, bukan garis bawah _ di URL Anda.

URL yang terlalu rumit, khususnya yang memuat beberapa parameter, dapat menyebabkan masalah bagi crawler dengan membuat banyak URL tidak penting yang mengarah ke konten identik atau serupa di situs Anda. Akibatnya, Googlebot akan memakan lebih banyak bandwidth dari yang semestinya, atau mungkin tidak dapat mengindeks semua konten di situs Anda dengan lengkap.

Penyebab umum masalah ini

Sejumlah besar URL yang tidak penting dapat diakibatkan oleh beberapa masalah. Di antaranya meliputi:

  • Pemfilteran tambahan atas kumpulan item. Banyak situs memberikan tampilan yang berbeda terkait kumpulan item atau hasil penelusuran yang sama, yang sering kali memungkinkan pengguna memfilter kumpulan ini dengan menggunakan kriteria yang ditentukan (misalnya: tunjukkan hotel di pantai kepada saya). Saat filter dapat dikombinasikan melalui penambahan (misalnya: hotel di pantai dan dengan pusat kebugaran), jumlah URL (tampilan data) di situs akan meluap. Membuat daftar hotel yang sedikit berbeda dalam jumlah besar adalah hal yang berlebihan karena Googlebot hanya perlu melihat sedikit daftar saja yang digunakan untuk menjangkau halaman untuk setiap hotel. Misalnya:
    • Properti hotel dengan "tingkat nilai":
      http://www.example.com/hotel-search-results.jsp?Ne=292&N=461
    • Properti hotel dengan "tingkat nilai" di pantai:
      http://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240
    • Properti hotel dengan "tingkat nilai" di pantai dan dilengkapi pusat kebugaran:
      http://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240+4294967270
  • Pembuatan dokumen yang dinamis. Hal ini dapat menyebabkan perubahan kecil karena penghitung, stempel waktu, atau iklan.
  • Parameter bermasalah di URL. ID Sesi, misalnya, dapat menghasilkan duplikasi dalam jumlah yang sangat besar dan juga jumlah URL yang lebih besar.
  • Mengurutkan parameter. Beberapa situs belanja yang besar menyediakan beberapa cara untuk mengurutkan item yang sama, sehingga menghasilkan jumlah URL yang lebih besar. Misalnya:
    http://www.example.com/results?search_type=search_videos&search_query=tpb&search_sort=relevance&search_category=25
  • Parameter yang tidak relevan dalam URL, misalnya parameter rujukan. Contoh:
    http://www.example.com/search/noheaders?click=6EE2BF1AF6A3D705D5561B7C3564D9C2&clickPage=OPD+Product+Page&cat=79
    http://www.example.com/discuss/showthread.php?referrerid=249406&threadid=535913
    http://www.example.com/products/products.asp?N=200063&Ne=500955&ref=foo%2Cbar&Cn=Accessories.
  • Masalah kalender. Kalender yang dibuat secara dinamis dapat menghasilkan link untuk tanggal pada masa mendatang dan tanggal yang telah lalu tanpa batasan tanggal awal atau akhir. Contoh:
    http://www.example.com/calendar.php?d=13&m=8&y=2011
    http://www.example.com/calendar/cgi?2008&month=jan
  • Link relatif yang rusak. Link relatif yang rusak sering kali dapat mengakibatkan ruang yang tidak terhingga. Masalah ini kerap kali timbul akibat elemen jalur berulang. Contoh:
    http://www.example.com/index.shtml/discuss/category/school/061121/html/interview/category/health/070223/html/category/business/070302/html/category/community/070413/html/FAQ.htm

Mengatasi masalah ini

Untuk menghindari potensi masalah dengan struktur URL, kami menyarankan hal berikut:

  • Pertimbangkan menggunakan file robots.txt untuk memblokir akses Googlebot ke URL yang bermasalah. Secara khusus, pertimbangkan untuk memblokir URL dinamis, seperti URL yang membuat hasil penelusuran, atau URL yang dapat membuat ruang tak terbatas, seperti kalender. Menggunakan ekspresi reguler dalam file robots.txt akan memungkinkan Anda memblokir banyak URL dengan mudah.
  • Jika memungkinkan, hindari penggunaan ID sesi dalam URL. Sebaiknya gunakan cookie. Periksa Pedoman Webmaster kami untuk informasi tambahan.
  • Jika memungkinkan, perpendek URL dengan memangkas parameter yang tidak dibutuhkan.
  • Jika situs Anda memiliki kalender yang tidak terhingga, tambahkan atribut nofollow untuk menghubungkan ke halaman kalender mendatang yang dibuat secara dinamis.
  • Periksa situs Anda untuk melihat adanya link relatif yang rusak.