"الزاحف" هو مصطلح عام لأي برنامج (مثل الروبوت أو العنكبوت) يتم استخدامه لاكتشاف المواقع الإلكترونية وفحصها تلقائيًا من خلال تتبُّع الروابط من صفحة ويب إلى أخرى. ويُطلق على الزاحف الرئيسي في Google اسم Googlebot. ويتضمّن هذا الجدول معلومات عن برامج الزحف الشائعة من Google والتي قد تراها في سجلات المُحيل، والآلية المطلوب اتّباعها لتحديد هذه البرامج في ملف robots.txt، والعلامات الوصفية لبرامج الروبوت، وأوامر X-Robots-Tag HTTP.
يعرض الجدول التالي برامج الزحف التي تستخدمها منتجات وخدمات مختلفة على Google:
- الرمز المميّز لوكيل المستخدم هو رمز يُستخدم في سطر
User-agent:
داخل ملف robots.txt بهدف المطابقة مع نوع من برامج الزحف عند كتابة قواعد الزحف الخاصة بموقعك الإلكتروني. بعض برامج الزحف لديها أكثر من رمز مميّز واحد على النحو الوارد في الجدول، ولا يلزمك سوى مطابقة رمز مميّز واحد للزاحف ليتم تطبيق القاعدة. هذه القائمة ليست حصرية، ولكنها تشمل معظم برامج الزحف التي قد يختبرها موقعك الإلكتروني. - السلسلة الكاملة لوكيل المستخدم هي سلسلة تُقدّم وصفًا كاملاً للزاحف وتظهر في الطلب وسجلّات الويب الخاصة بك.
الزاحف | الرمز المميز لوكيل المستخدم (الرمز المميز للمنتج) | السلسلة الكاملة لوكيل المستخدم |
---|---|---|
APIs-Google |
|
APIs-Google (+https://developers.google.com/webmasters/APIs-Google.html) |
AdSense |
|
Mediapartners-Google |
(لفحص جودة الإعلان على صفحة الويب على نظام التشغيل Android) |
|
Mozilla/5.0 (Linux; Android 5.0; SM-G920A) AppleWebKit (KHTML, like Gecko) Chrome Mobile Safari (compatible; AdsBot-Google-Mobile; +http://www.google.com/mobile/adsbot.html) |
(لفحص جودة الإعلان على صفحة الويب على هاتف iPhone) |
|
Mozilla/5.0 (iPhone; CPU iPhone OS 9_1 like Mac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko) Version/9.0 Mobile/13B143 Safari/601.1 (compatible; AdsBot-Google-Mobile; +http://www.google.com/mobile/adsbot.html) |
(لفحص جودة الإعلان في صفحة الويب على جهاز سطح المكتب) |
|
AdsBot-Google (+http://www.google.com/adsbot.html ) |
Googlebot Image |
|
Googlebot-Image/1.0 |
Googlebot News |
|
Googlebot-News |
Googlebot Video |
|
Googlebot-Video/1.0 |
Googlebot Desktop |
|
|
Googlebot Smartphone |
|
|
Mobile AdSense |
|
(أنواع متعدّدة من الأجهزة الجوّالة) (compatible; Mediapartners-Google/2.1 و+http://www.google.com/bot.html ) |
نظام التشغيل Android للتطبيقات المتوافقة مع الأجهزة الجوّالة (لفحص جودة الإعلان على صفحة تطبيق متوافق مع Android. ويتّبع قواعد برامج الروبوت AdsBot-Google.) |
|
AdsBot-Google-Mobile-Apps |
|
|
|
|
الوكلاء الحاليون:
الوكيل السابق (متوقّف): |
|
Duplex على الويب |
|
Mozilla/5.0 (Linux; Android 8.0; Pixel 2 Build/OPD3.170816.012; DuplexWeb-Google/1.0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.131 Mobile Safari/537.36 |
Google Favicon (لاسترداد الرموز المفضّلة للخدمات المختلفة) |
في ما يتعلق بالطلبات التي يجريها المستخدم، يتجاهل قواعد robots.txt |
Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.75 Safari/537.36 Google Favicon |
تقنيّة Web Light |
|
Mozilla/5.0 (Linux; Android 4.2.1; en-us; Nexus 5 Build/JOP40D) AppleWebKit/535.19 (KHTML, like Gecko; googleweblight) Chrome/38.0.1025.166 Mobile Safari/535.19 |
Google StoreBot | Storebot-Google |
وكيل أجهزة كمبيوتر سطح المكتب:
وكيل الأجهزة الجوّالة:
|
وكلاء المستخدم في robots.txt
عندما يتم التعرّف على العديد من وكلاء المستخدم في ملف robots.txt، يتّبع محرّك البحث Google وكيل المستخدم الأكثر تحديدًا. إذا كنت تريد أن تزحف جميع برامج الزحف من Google إلى صفحاتك، لست بحاجة إلى استخدام ملف robots.txt على الإطلاق. إذا كنت تريد منع جميع برامج الزحف في Google من الدخول إلى محتوى معيّن أو السماح لها بذلك، يمكنك إجراء ذلك من خلال ضبط Googlebot على أنه وكيل المستخدم. على سبيل المثال، إذا كنت تريد أن تظهر جميع صفحاتك في "بحث Google"، وإذا كنت تريد أن تظهر إعلانات AdSense على صفحاتك، لست بحاجة إلى ملف robots.txt. وإذا كنت تريد حظر بعض الصفحات من الظهور في "بحث Google" نهائيًّا، سيؤدي حظر وكيل المستخدم Googlebot
أيضًا إلى حظر جميع برامج وكيل المستخدم الأخرى من Google.
وإذا أردت التحكم بشكل دقيق في المحتوى الذي سيظهر ضمن نتائج البحث، يمكنك تطبيق توجيهات محددة. على سبيل المثال، قد تريد أن تظهر جميع صفحاتك في "بحث Google"، ولكن لا تريد أن يتم الزحف إلى الصور في دليلك الشخصي. في هذه الحالة، استخدِم ملف robots.txt لمنع وكيل المستخدم Googlebot-Image
من الزحف إلى الملفات في دليلك الشخصي (مع السماح لبرنامج Googlebot بالزحف إلى جميع الملفات)، على هذا النحو:
User-agent: Googlebot Disallow: User-agent: Googlebot-Image Disallow: /personalكمثال آخر، لنفترض أنك تريد نشر إعلانات على جميع صفحاتك، لكنك لا تريد أن تظهر هذه الصفحات في "بحث Google". في هذه الحالة، يمكنك حظر Googlebot مع السماح لوكيل المستخدم
Mediapartners-Google
، على هذا النحو:
User-agent: Googlebot Disallow: / User-agent: Mediapartners-Google Disallow:
برامج وكيل المستخدم في العلامات الوصفية لبرامج الروبوت
تستخدم بعض الصفحات عدة علامات وصفية لبرامج الروبوت لتحديد الأوامر لبرامج الزحف المختلفة، على النحو التالي:
<meta name="robots" content="nofollow"> <meta name="googlebot" content="noindex">
وفي هذه الحالة، يستخدم Google إجمالي الأوامر السلبية ويتّبع برنامج Googlebot كلّاً من الأمرَين noindex
وnofollow
. يمكنك الاطّلاع على مزيد من المعلومات التفصيلية عن التحكّم في آلية زحف Google إلى موقعك الإلكتروني وفهرسته.