Menjaga kesederhanaan struktur URL

Struktur URL situs sebaiknya dibuat sesederhana mungkin. Pertimbangkan untuk mengelola konten Anda agar URL disusun secara logis dan dengan cara yang paling dapat dipahami oleh manusia (jika memungkinkan, kata yang terbaca daripada nomor ID yang panjang). Misalnya, apabila Anda menelusuri informasi mengenai penerbangan, URL seperti http://en.wikipedia.org/wiki/Aviation akan membantu Anda untuk memutuskan apakah Anda akan mengklik link tersebut atau tidak. Sebuah URL seperti http://www.example.com/index.php?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1, kurang menarik bagi para pengguna.

Pertimbangkan menggunakan tanda baca di URL Anda. URL http://www.example.com/green-dress.html jauh lebih berguna bagi kami daripada http://www.example.com/greendress.html. Kami menyarankan agar Anda menggunakan garis hubung (-) dari pada garis bawah (_) di URL Anda.

URL yang terlalu rumit, khususnya yang memuat banyak parameter, dapat menyebabkan masalah bagi crawler dengan menciptakan sejumlah besar URL tidak penting yang mengarah ke konten identik atau serupa di situs Anda. Akibatnya, Googlebot akan memakan lebih banyak bandwidth dari yang semestinya, atau bisa jadi tidak dapat mengindeks semua konten di situs Anda dengan lengkap.

Sebab-sebab umum masalah ini

Sejumlah besar URL yang tidak penting dapat diakibatkan oleh beberapa masalah. Di antaranya meliputi:

  • Penyaringan tambahan atas serangkaian item Banyak situs yang menyediakan tampilan yang sama untuk serangkaian item atau hasil telusur, sering kali membuat pengguna menyaringnya rangkaian ini dengan menggunakan kriteria yang ditentukan (misalnya: perlihatkan hotel-hotel di pantai kepada saya). Saat filter bisa dikombinasikan melalui penambahan (contoh: hotel di pantai dan dilengkapi pusat kebugaran), jumlah URL (tampilan data) pada situs akan meledak. Membuat daftar hotel yang sedikit berbeda dalam jumlah besar adalah hal yang berlebihan, karena Googlebot hanya perlu melihat sedikit daftar saja yang digunakan untuk menjangkau halaman untuk setiap hotel. Contoh:
    • Properti hotel dengan "tingkat nilai":
      http://www.example.com/hotel-search-results.jsp?Ne=292&N=461
    • Properti hotel dengan "tingkat nilai" di pantai:
      http://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240
    • Properti hotel dengan "tingkat nilai" di pantai dan dilengkapi pusat kebugaran:
      http://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240+4294967270
  • Pembuatan dokumen yang dinamis. Hal ini dapat menyebabkan perubahan kecil karena penghitung, stempel waktu, atau iklan.
  • Parameter bermasalah di URL. ID Sesi, misalnya, dapat menghasilkan duplikasi dalam jumlah yang sangat besar dan juga jumlah URL yang lebih besar.
  • Mengurutkan parameter. Beberapa situs belanja besar menyediakan banyak cara untuk mengurutkan item yang sama, sehingga menghasilkan URL dalam jumlah yang sangat besar. Misalnya:
    http://www.example.com/results?search_type=search_videos&search_query=tpb&search_sort=relevance
       &search_category=25
  • Parameter yang tidak relevan dalam URL, misalnya parameter rujukan. Contoh:
    http://www.example.com/search/noheaders?click=6EE2BF1AF6A3D705D5561B7C3564D9C2&clickPage=
       OPD+Product+Page&cat=79
    http://www.example.com/discuss/showthread.php?referrerid=249406&threadid=535913
    http://www.example.com/products/products.asp?N=200063&Ne=500955&ref=foo%2Cbar&Cn=Accessories.
  • Masalah kalender. Kalender yang dibuat secara dinamis dapat menghasilkan link untuk tanggal di masa mendatang dan tanggal terdahulu tanpa batasan pada awal tanggal akhir. Contoh:
    http://www.example.com/calendar.php?d=13&m=8&y=2011
    http://www.example.com/calendar/cgi?2008&month=jan
  • Link relatif yang rusak. Link relatif yang rusak sering kali dapat mengakibatkan ruang yang tidak terhingga. Masalah ini kerap kali timbul akibat elemen jalur berulang. Contoh:
    http://www.example.com/index.shtml/discuss/category/school/061121/html/interview/
      category/health/070223/html/category/business/070302/html/category/community/070413/html/FAQ.htm
Langkah-Langkah untuk Mengatasi Masalah Ini

Untuk menghindari potensi masalah dengan struktur URL, kami menyarankan sebagai berikut:

  • Pertimbangkan menggunakan file robots.txt untuk memblokir akses Googlebot ke URL yang bermasalah. Secara khusus, sebaiknya pertimbangkan untuk memblokir URL dinamis, seperti URL yang membuat hasil penelusuran, atau URL yang dapat membuat ruang tak terbatas, seperti kalender. Menggunakan ekspresi reguler dalam file robots.txt akan memungkinkan Anda memblokir sejumlah besar URL dengan mudah.
  • Bila memungkinkan, hindari penggunaan ID sesi dalam URL. Lebih baik gunakan cookie. Periksa Pedoman Webmaster untuk informasi tambahan.
  • Jika memungkinkan, perpendek URL dengan memangkas parameter yang tidak dibutuhkan.
  • Bila situs Anda memiliki kalender yang tidak terhingga, tambahkan atribut nofollow untuk menghubungkan ke halaman kalender mendatang yang dibuat secara dinamis.
  • Periksa situs Anda untuk melihat adanya link relatif yang rusak.