Cara Kerja Google Penelusuran

Bagaimana cara kerja Google? Berikut ini penjelasan singkat dan panjangnya.

Google mendapatkan informasi dari berbagai sumber, termasuk:

  • Halaman di Internet,
  • Konten yang dikirim pengguna seperti kiriman pengguna Google Bisnisku dan Maps,
  • Pemindaian buku,
  • Database publik di Internet,
  • dan banyak sumber lainnya.

Namun, halaman ini difokuskan pada halaman di Internet.

Penjelasan singkat

Google mengikuti 3 langkah dasar untuk menampilkan hasil dari halaman:

Crawling

Langkah pertama adalah mencari tahu halaman apa yang ada di web. Tidak ada registry pusat untuk semua halaman web, sehingga Google terus-menerus menelusuri halaman baru dan menambahkan halaman ke daftar halaman yang dikenal. Beberapa halaman sudah dikenal karena telah dikunjungi Google sebelumnya. Halaman lain akan ditemukan saat Google mengikuti link dari halaman yang dikenal ke halaman baru. Selain itu, halaman lain akan ditemukan saat pemilik situs mengirim daftar halaman (peta situs) untuk di-crawl oleh Google. Jika Anda menggunakan host web terkelola, seperti Wix atau Blogger, host web tersebut mungkin memberi tahu Google untuk meng-crawl halaman yang diperbarui atau baru yang Anda buat.

Setelah Google menemukan URL halaman, Google akan mengunjungi atau meng-crawl halaman untuk mencari tahu apa yang ada di dalamnya. Google akan merender halaman dan menganalisis konten teks, non-teks, serta tata letak visual secara keseluruhan untuk menentukan tempat halaman ditampilkan dalam Hasil penelusuran. Semakin baik Google memahami situs Anda, semakin baik kami dapat mencocokkannya kepada orang yang mencari konten Anda.

Untuk meningkatkan crawling situs:

  • Verifikasi bahwa Google dapat menjangkau halaman di situs Anda, dan pastikan halaman tersebut sudah terlihat benar. Googl e mengakses web sebagai pengguna anonim (pengguna tanpa sandi atau informasi). Google juga harus dapat melihat semua gambar dan elemen lain pada halaman agar dapat memahaminya dengan benar. Anda dapat melakukan pemeriksaan cepat dengan mengetikkan URL halaman Anda pada Pengujian Situs Mobile-Friendly.
  • Jika sudah membuat atau memperbarui satu halaman, Anda dapat mengirimkan setiap URL ke Google. Untuk memberi tahu Google tentang banyak halaman baru atau yang diperbarui sekaligus, gunakan peta situs.
  • Jika Anda meminta Google untuk meng-crawl satu halaman saja, pastikan halaman tersebut adalah halaman beranda Anda. Sejauh yang diperhatikan Google, halaman beranda Anda adalah halaman paling penting di situs Anda. Untuk mendorong crawl situs yang lengkap, pastikan halaman beranda Anda (dan semua halaman) memiliki sistem navigasi situs yang bagus yang ditautkan ke semua bagian dan halaman penting di situs Anda. Tindakan ini membantu pengguna (dan Google) menjelajahi situs Anda. Untuk situs berskala lebih kecil (kurang dari 1.000 halaman), cukup pastikan Google mengetahui halaman beranda Anda saja, asalkan Google dapat menjangkau semua halaman lain dengan mengikuti jalur link yang dimulai dari halaman beranda Anda.
  • Tautkan halaman Anda ke halaman lain yang sudah diketahui Google. Namun, perhatikan bahwa link di iklan, link yang Anda bayar untuk ditempatkan di situs lain, link di komentar, atau link lain yang tidak mengikuti Pedoman Webmaster Google tidak akan diikuti oleh Google.

Pengindeksan

Setelah halaman ditemukan, Google akan mencoba memahami apa yang ada di halaman tersebut. Proses ini disebut pengindeksan. Google akan menganalisis konten halaman, membuat katalog file gambar dan video yang disematkan pada halaman, dan mencoba memahami halaman tersebut. Informasi ini disimpan di indeks Google, sebuah database besar yang disimpan di banyak (sangat banyak) komputer.

Untuk meningkatkan pengindeksan halaman:

  • Buat judul halaman yang pendek dan bermakna.
  • Gunakan judul halaman yang menyampaikan subjek halaman.
  • Gunakan teks untuk menyampaikan konten, bukan gambar. Google dapat memahami sebagian gambar dan video, tetapi tidak sebaik memahami teks. Setidaknya beri keterangan pada video dan gambar dengan teks alternatif dan atribut lain yang sesuai.

Penayangan (dan pemberian peringkat)

Saat pengguna mengetik kueri, Google mencoba menemukan jawaban yang paling relevan dari indeksnya berdasarkan banyak faktor. Google mencoba menentukan jawaban dengan kualitas tertinggi, dan memperhitungkan pertimbangan lain yang akan memberikan pengalaman pengguna terbaik dan jawaban yang paling tepat, dengan mempertimbangkan hal-hal seperti lokasi, bahasa, dan perangkat pengguna (desktop atau ponsel). Misalnya, jawaban untuk penelusuran "bengkel reparasi sepeda" bagi pengguna di Bandung akan berbeda dengan jawaban bagi pengguna di Bangkok. Google tidak menerima pembayaran untuk memberi peringkat halaman lebih tinggi, dan pemberian peringkat dilakukan secara terprogram.

Untuk meningkatkan penayangan dan pemberian peringkat:

Penjelasan panjang

Ingin mendapatkan informasi selengkapnya? Berikut informasinya:

Penjelasan panjang

Crawling

Crawling adalah proses yang digunakan Googlebot untuk mengunjungi halaman baru dan yang diperbarui guna ditambahkan ke indeks Google.

Kami menggunakan banyak sekali komputer untuk mengambil (atau "meng-crawl") miliaran halaman di web. Program yang melakukan pengambilan ini disebut Googlebot (juga dikenal sebagai robot, bot, atau spider). Googlebot menggunakan proses algoritme untuk menentukan situs mana yang akan di-crawl, seberapa sering, dan berapa banyak halaman yang diambil dari setiap situs.

Proses crawling Google dimulai dengan daftar URL halaman web, yang dihasilkan dari proses crawling sebelumnya, dan ditambahkan dengan data Peta Situs yang disediakan oleh pemilik situs. Saat mengunjungi halaman, Googlebot menemukan link pada halaman dan menambahkannya ke daftar halaman untuk di-crawl. Situs baru, perubahan terhadap situs yang ada, dan link mati akan dicatat serta digunakan untuk memperbarui indeks Google.

Selama crawling, Google merender halaman menggunakan Chrome versi terbaru. Sebagai bagian dari proses rendering, skrip halaman apa pun yang ditemui akan dijalankan. Jika situs Anda menggunakan konten yang dihasilkan secara dinamis, pastikan Anda mengikuti dasar-dasar SEO JavaScript.

Bagaimana cara Google mengetahui halaman yang tidak di-crawl?

  • Halaman yang diblokir dalam robots.txt tidak akan di-crawl, tetapi mungkin masih diindeks jika tertaut ke halaman lain. (Google dapat menyimpulkan konten halaman dengan link yang mengarah ke halaman itu, dan mengindeks halaman tanpa mengurai kontennya.)
  • Google tidak dapat meng-crawl halaman apa pun yang tidak dapat diakses oleh pengguna anonim. Dengan demikian, setiap login atau perlindungan otorisasi lainnya akan mencegah halaman di-crawl.
  • Halaman yang telah di-crawl dan dianggap sebagai duplikat halaman lain akan jarang di-crawl.

Meningkatkan crawling

Gunakan teknik berikut untuk membantu Google menemukan halaman yang tepat di situs Anda:

Pengindeksan

Googlebot memproses setiap halaman yang di-crawl untuk memahami konten halaman. Hal ini mencakup pemrosesan konten teks, atribut dan tag konten utama, seperti atribut alt dan tag <title>, gambar, video, dan lainnya. Googlebot dapat memproses banyak jenis konten, tetapi tidak semuanya. Misalnya, kami tidak dapat memproses konten beberapa file multimedia.

Di antara crawling dan pengindeksan, Google menentukan apakah suatu halaman merupakan duplikat atau kanonis dari halaman lain. Jika halaman dianggap duplikat, halaman akan lebih jarang di-crawl. Halaman yang mirip akan dikelompokkan bersama menjadi dokumen, yang merupakan sebuah kelompok berisi 1 atau beberapa halaman yang menyertakan halaman kanonis (yang paling mewakili grup) dan duplikat apa pun yang ditemui (yang mungkin hanya berupa URL alternatif untuk menjangkau halaman yang sama, atau mungkin versi seluler atau desktop alternatif dari halaman yang sama).

Perhatikan bahwa Google tidak mengindeks halaman dengan perintah noindex (header atau tag). Namun, Google harus dapat melihat perintah tersebut. Oleh karena itu, jika halaman diblokir oleh file robots.txt, halaman login, atau perangkat lain, halaman tersebut bisa saja diindeks meskipun tidak dikunjungi oleh Google.

Meningkatkan pengindeksan

Terdapat banyak teknik untuk meningkatkan kemampuan Google dalam memahami konten halaman Anda:

Apa yang dimaksud dengan "dokumen"?

Secara internal, Google merepresentasikan web sebagai kumpulan dokumen (yang sangat besar). Setiap dokumen mewakili satu atau beberapa halaman web. Halaman tersebut sama atau sangat mirip, tetapi pada dasarnya adalah konten yang sama dan dapat dijangkau oleh URL yang berbeda. URL yang berbeda dalam dokumen dapat mengarah ke halaman yang sama persis (misalnya, example.com/dresses/summer/1234 dan example.com?product=1234 mungkin menampilkan halaman yang sama), atau halaman yang sama dengan sedikit variasi yang ditujukan bagi pengguna di perangkat yang berbeda (misalnya, example.com/mypage untuk pengguna desktop dan m.example.com/mypage untuk pengguna seluler).

Google akan memilih salah satu URL dalam dokumen dan menentukannya sebagai URL kanonis dokumen. URL kanonis dokumen adalah URL yang paling sering di-crawl serta diindeks oleh Google; URL lain dianggap sebagai duplikat atau alternatif, dan terkadang di-crawl, atau ditayangkan sesuai dengan permintaan pengguna. Contohnya, jika URL kanonis dokumen adalah URL seluler, Google mungkin masih akan menayangkan URL desktop (alternatif) untuk pengguna yang menelusuri di desktop.

Sebagian besar laporan di Search Console mengaitkan data ke URL kanonis dokumen. Beberapa alat (seperti Alat Inspeksi URL) mendukung pengujian URL alternatif, tetapi memeriksa URL kanonis juga akan memberikan informasi tentang URL alternatif.

Anda dapat memberi tahu Google URL mana yang Anda pilih sebagai kanonis, tetapi Google dapat memilih URL kanonis yang berbeda karena berbagai alasan.

Berikut adalah ringkasan istilah beserta cara penggunaan istilah di Search Console:

  • Dokumen: Kumpulan halaman yang mirip. Memiliki URL kanonis, dan mungkin URL alternatif, jika situs Anda memiliki halaman duplikat. URL dalam dokumen dapat berasal dari organisasi yang sama atau berbeda (domain root, misalnya "google" di www.google.com). Google memilih URL terbaik untuk ditampilkan di Hasil penelusuran menurut platform (seluler/desktop), bahasa atau lokasi pengguna, dan banyak variabel lainnya. Google menemukan halaman terkait di situs Anda dengan crawling organik, atau dengan fitur yang diimplementasikan situs seperti pengalihan atau tag <link rel=alternate/canonical>. Halaman terkait di organisasi lain hanya dapat ditandai sebagai alternatif jika dikodekan secara eksplisit oleh situs Anda (melalui pengalihan atau tag link).
  • URL: URL yang digunakan untuk menjangkau konten tertentu di situs. Situs mungkin me-resolve URL yang berbeda untuk halaman yang sama.
  • Halaman: Halaman web tertentu, dijangkau oleh satu atau beberapa URL. Halaman dapat memiliki versi yang berbeda, bergantung pada platform pengguna (seluler, desktop, tablet, dan sebagainya).
  • Versi: Satu variasi halaman, yang biasanya dikategorikan sebagai "seluler", "desktop", dan "AMP" (meskipun AMP dapat memiliki versi seluler dan desktop). Setiap versi dapat memiliki URL yang berbeda (example.com vs m.example.com) atau URL yang sama (jika situs Anda menggunakan penayangan dinamis atau desain web yang responsif, URL yang sama dapat menampilkan versi yang berbeda dari halaman yang sama) bergantung pada konfigurasi situs Anda. Variasi bahasa tidak dianggap sebagai versi yang berbeda, tetapi dokumen yang berbeda.
  • URL atau halaman kanonis: URL yang dianggap Google sebagai yang paling mewakili dokumen. Google selalu meng-crawl URL ini; URL duplikat dalam dokumen terkadang juga di-crawl.
  • URL atau halaman alternatif/duplikat: URL dokumen yang mungkin di-crawl Google sesekali. Google juga menayangkan URL ini jika sesuai dengan pengguna dan permintaan (misalnya, URL alternatif bagi pengguna desktop akan ditayangkan untuk permintaan desktop, dan bukan URL seluler kanonis).
  • Situs: Biasanya digunakan sebagai sinonim untuk situs (kumpulan halaman web yang terkait secara konseptual), tetapi terkadang digunakan sebagai sinonim untuk properti Search Console, meskipun properti sebenarnya dapat ditentukan sebagai hanya bagian dari sebuah situs. Situs dapat mencakup subdomain (dan bahkan domain, untuk halaman AMP yang ditautkan dengan benar).

Halaman dengan konten yang sama dalam bahasa yang berbeda akan disimpan dalam dokumen berbeda yang merujuk satu sama lain menggunakan tag hreflang. Oleh karena itu, sebaiknya gunakan tag hreflang untuk konten yang diterjemahkan.

Menayangkan hasil

Saat pengguna memasukkan kueri, mesin kami menelusuri indeks untuk mencari halaman yang cocok dan menampilkan hasil yang kami yakini paling relevan bagi pengguna. Relevansi ditentukan oleh ratusan faktor, dan kami selalu berupaya meningkatkan algoritme kami. Google mempertimbangkan pengalaman pengguna dalam memilih dan memberi peringkat pada hasil. Oleh karena itu, pastikan halaman Anda dimuat dengan cepat dan mobile-friendly.

Meningkatkan penayangan

  • Jika hasil Anda ditujukan untuk pengguna di lokasi atau bahasa tertentu, beri tahu Google tentang preferensi Anda.
  • Pastikan halaman Anda dimuat dengan cepat dan mobile-friendly.
  • Ikuti Pedoman Webmaster untuk menghindari kendala umum dan meningkatkan peringkat situs Anda.
  • Pertimbangkan untuk mengimplementasikan fitur hasil Penelusuran untuk situs Anda, seperti kartu resep atau kartu artikel.
  • Implementasikan AMP agar pemuatan halaman di perangkat seluler lebih cepat. Beberapa halaman AMP juga memenuhi syarat untuk fitur penelusuran tambahan, seperti carousel berita utama.
  • Algoritme Google terus ditingkatkan; daripada mencoba menebak algoritme dan mendesain halaman Anda untuk algoritme itu, buat konten yang bagus dan baru yang diinginkan pengguna, dan ikuti pedoman kami.

Versi yang lebih lama

Anda dapat menemukan penjelasan yang lebih panjang lagi terkait cara kerja Google Penelusuran di sini (berisi gambar dan video.)