نظرة عامة على برامج الزحف وبرامج الجلب من Google (برامج وكيل المستخدم)
تستخدم Google برامج الزحف والجلب لتنفيذ الإجراءات الخاصة بمنتجاتها، سواءً بشكل تلقائي أو استنادًا إلى طلب المستخدم.
"برنامج الزحف" أو "الزاحف" (يُسمّى أيضًا "الروبوت" أو "العنكبوت") هو مصطلح عام لأي برنامج يتم استخدامه لاكتشاف المواقع الإلكترونية وفحصها تلقائيًا من خلال تتبُّع الروابط من صفحة ويب إلى أخرى. ويُطلق الاسم Googlebot على زاحف Google الرئيسي المستخدَم في "بحث Google".
أمّا برامج الجلب، فهي أدوات كالمتصفّح، تحصل للمستخدم على عنوان URL المحدّد الذي طلبه.
تعرض الجداول التالية برامج الزحف والجلب من Google التي تستخدمها المنتجات والخدمات المختلفة، بالإضافة إلى كيفية رؤيتها في سجلّات المُحيل الخاصة بك، وكيفية تحديدها في ملف robots.txt. وهذه القوائم ليست شاملة، بل تتضمّن فقط برامج الزحف والجلب الأكثر شيوعًا والتي قد تظهر ضمن ملفات السجلّ.
-
يُستخدم الرمز المميّز لوكيل المستخدم في سطر
User-agent:
داخل ملف robots.txt بهدف المطابقة مع نوع من برامج الزحف عند كتابة قواعد الزحف الخاصة بموقعك الإلكتروني. بعض برامج الزحف لديها أكثر من رمز مميّز واحد على النحو الوارد في الجدول، وما عليك سوى مطابقة رمز مميّز واحد للزاحف ليتم تطبيق القاعدة. هذه القائمة ليست كاملة، ولكنها تشمل معظم برامج الزحف التي قد تعمل على موقعك الإلكتروني. - السلسلة الكاملة لوكيل المستخدم هي سلسلة تقدّم وصفًا كاملاً للزاحف وتظهر في طلب HTTP وسجلّات الويب الخاصة بك.
برامج الزحف الشائعة
تُستخدم برامج الزحف الشائعة من Google للعثور على المعلومات اللازمة لإنشاء فهارس "بحث Google" ولتنفيذ عمليات زحف أخرى خاصة بالمنتجات، ولأغراض التحليل. ودائمًا ما تتّبع هذه البرامج قواعد robots.txt وتزحف عمومًا من نطاقات عناوين IP المنشورة في كائن googlebot.json.
برامج الزحف الشائعة | |||||
---|---|---|---|---|---|
Googlebot Smartphone |
|
||||
Googlebot Desktop |
|
||||
Googlebot للصور |
يُستخدم للزحف إلى عناوين URL الخاصة بالصور في "صور بحث Google" والمنتجات المستندة إلى الصور.
|
||||
Googlebot للأخبار |
يستخدم "Googlebot للأخبار" برنامج Googlebot للزحف إلى المقالات الإخبارية، لكنّه يستجيب للرمز المميز التابع لوكيل المستخدم السابق
|
||||
Googlebot للفيديوهات |
يُستخدم للزحف إلى عناوين URL الخاصة بالفيديوهات في Google Video والمنتجات المستندة إلى الفيديوهات.
|
||||
Google StoreBot |
يزحف Google StoreBot إلى أنواع معيّنة من الصفحات، بما في ذلك على سبيل المثال لا الحصر، صفحات تفاصيل المنتجات وصفحات سلّات التسوق وصفحات الدفع.
|
||||
Google-InspectionTool |
Google-InspectionTool هو الزاحف الذي تستخدمه أدوات الاختبار في "بحث Google"، مثل اختبار النتائج الغنية بصريًا وفحص عنوان URL في Search Console. بالإضافة إلى وكيل المستخدم والرمز المميز لوكيل المستخدم، يحاكي هذا الزاحف أيضًا Googlebot.
|
||||
GoogleOther |
GoogleOther هو الزاحف العام الذي يمكن أن تستخدمه فِرق خاصة بمنتجات متعددة لجلب محتوى متاح للجميع من مواقع إلكترونية. على سبيل المثال، يمكن استخدامه للزحف مرة واحدة لإجراء عمليات تطوير وأبحاث داخلية.
|
||||
GoogleOther-Image |
GoogleOther-Image هو نسخة GoogleOther التي تم تحسينها بغرض جلب عناوين URL الخاصة بالصور المتاحة للجميع.
|
||||
GoogleOther-Video |
GoogleOther-Video هو نسخة GoogleOther التي تم تحسينها بغرض جلب عناوين URL الخاصة بالفيديوهات المتاحة للجميع.
|
||||
Google-CloudVertexBot |
يزحف Google-CloudVertexBot إلى مواقع إلكترونية بناءً على طلب مالكي المواقع الإلكترونية عند إنشاء وكلاء مستندين إلى الذكاء الاصطناعي عن طريق Vertex AI.
|
||||
Google-Extended |
|
برامج الزحف في الحالات الخاصة
تُستخدم برامج الزحف المخصّصة للحالات الخاصة في منتجات معيّنة إذا كانت هناك اتفاقية بشأن عملية الزحف بين الموقع الإلكتروني الذي يتم الزحف إليه والمنتج. على سبيل المثال، يتجاهل AdsBot
وكيل المستخدم العام robots.txt (*
) الحاصل على إذن ناشر الإعلان. يمكن أن تتجاهل برامج الزحف في الحالات الخاصة قواعد robots.txt، وبذلك تعمل من نطاق IP مختلف عن برامج الزحف الشائعة. ويتم نشر نطاقات IP في الكائن special-crawlers.json.
برامج الزحف في الحالات الخاصة | |||||
---|---|---|---|---|---|
APIs-Google |
تستخدمه أداة Google APIs لعرض رسائل الإشعارات الفورية. وهو يتجاهل وكيل المستخدم العام (
|
||||
AdsBot Mobile Web |
يفحص جودة الإعلانات على صفحات الويب في الأجهزة الجوّالة.
وهو يتجاهل وكيل المستخدم العام (
|
||||
AdsBot |
يفحص جودة الإعلانات على صفحات الويب في أجهزة الكمبيوتر المكتبي.
وهو يتجاهل وكيل المستخدم العام (
|
||||
AdSense |
يزور زاحف AdSense موقعك الإلكتروني لتحديد محتواه بهدف تقديم إعلانات ملائمة. وهو يتجاهل وكيل المستخدم العام (
|
||||
Mobile AdSense |
يزور زاحف Mobile AdSense موقعك الإلكتروني لتحديد محتواه بهدف تقديم إعلانات ملائمة. وهو يتجاهل وكيل المستخدم العام (
|
||||
Google-Safety |
يتعامل وكيل المستخدم Google-Safety مع عمليات الزحف المتعلّقة بإساءة الاستخدام، مثل اكتشاف البرامج الضارة المرتبطة بالروابط المنشورة بشكل علني على خدمات Google. سيتجاهل وكيل المستخدم هذا قواعد robots.txt.
|
برامج الجلب التي يشغّلها المستخدم
الغرض من برامج الجلب التي يشغّلها المستخدم هو تنفيذ وظيفة جلب خاصة بالمنتج. على سبيل المثال، تعالج أداة إثبات ملكية الموقع على Google طلب المستخدم، أو يتضمّن موقع إلكتروني تتم استضافته على Google Cloud (GCP) ميزة تسمح لمستخدمي الموقع باسترداد خلاصة RSS خارجية. وتتجاهل عادةً برامج الجلب هذه قواعد robots.txt لأنّ المستخدم هو الذي طلب عملية الجلب. أمّا نطاقات IP التي تستخدمها برامج الجلب التي يشغّلها المستخدم، فيتم نشرها في الكائنَين user-triggered-fetchers.json وuser-triggered-fetchers-google.json.
برامج الجلب التي يشغّلها المستخدم | |||||
---|---|---|---|---|---|
Feedfetcher |
يُستخدم برنامج Feedfetcher للزحف إلى خلاصات RSS أو Atom على تطبيق "Google بودكاست" و"أخبار Google" وPubSubHubbub.
|
||||
"مركز الناشرين" في Google |
يجلب ويعالج الخلاصات التي يوفّرها الناشرون بشكل واضح من خلال "مركز الناشرين" ليتم استخدامها في الصفحات المقصودة في "أخبار Google".
|
||||
Google Read Aloud |
استنادًا إلى طلب المستخدم، يجلب Google Read Aloud صفحات الويب ويقرأها من خلال تقنية تحويل النص إلى كلام.
|
||||
أداة إثبات ملكية الموقع على Google |
استنادًا إلى طلب المستخدم، تجلب أداة "إثبات ملكية الموقع على Google" الرموز المميَّزة لتأكيد ملكية النطاق في Search Console.
|
ملاحظة عن Chrome/W.X.Y.Z في برامج وكيل المستخدم
أينما ترِد سلسلة Chrome/W.X.Y.Z ضمن سلاسل برامج وكيل المستخدم في الجدول، تكون W.X.Y.Z عبارة عن عنصر نائب يمثّل إصدار متصفّح Chrome الذي يستخدمه وكيل المستخدم هذا، مثلاً، 41.0.2272.96
. سيزداد رقم الإصدار هذا بمرور الوقت ليطابق أحدث نسخة من إصدارات Chromium يستخدمها Googlebot.
إذا كنت تبحث في سجلّاتك أو تجري فلترة للخادم للعثور على وكيل مستخدم بهذا النمط، استخدِم أحرفَ بدلٍ لرقم الإصدار بدلاً من تحديد رقم إصدار معيّن.
برامج وكيل المستخدم في robots.txt
عندما يتم التعرّف على العديد من برامج وكيل المستخدم في ملف robots.txt، يتّبع محرّك بحث Google وكيل المستخدم الأكثر تحديدًا. إذا كنت تريد أن تزحف جميع برامج الزحف من Google إلى صفحاتك، لست بحاجة إلى استخدام ملف robots.txt على الإطلاق. إذا كنت تريد منع جميع برامج الزحف في Google من الدخول إلى محتوى معيّن أو السماح لها بهذا، يمكنك إجراء ذلك من خلال ضبط Googlebot على أنّه وكيل المستخدم. على سبيل المثال، إذا كنت تريد أن تظهر جميع صفحاتك في "بحث Google"، وإذا كنت تريد أن تظهر إعلانات AdSense على صفحاتك، لست بحاجة إلى ملف robots.txt. وإذا كنت تريد حظر بعض الصفحات من الظهور في "بحث Google" نهائيًا، سيؤدي حظر وكيل المستخدم Googlebot
أيضًا إلى حظر جميع برامج وكيل المستخدم الأخرى من Google.
إذا أردت التحكم بشكل أدقّ في المحتوى الذي سيظهر ضمن نتائج البحث، يمكنك استخدام قواعد أكثر تحديدًا. على سبيل المثال، قد تريد أن تظهر جميع صفحاتك في "بحث Google"، ولكن لا تريد أن يتم الزحف إلى الصور في دليلك الشخصي. في هذه الحالة، استخدِم ملف robots.txt لمنع وكيل المستخدم Googlebot-Image
من الزحف إلى الملفات في دليلك الشخصي (مع السماح لبرنامج Googlebot بالزحف إلى جميع الملفات)، على هذا النحو:
User-agent: Googlebot Disallow: User-agent: Googlebot-Image Disallow: /personal
كمثال آخر، لنفترض أنّك تريد نشر إعلانات على جميع صفحاتك، لكنّك لا تريد أن تظهر هذه الصفحات في "بحث Google". في هذه الحالة، يمكنك حظر Googlebot مع السماح بوكيل المستخدم Mediapartners-Google
، على هذا النحو:
User-agent: Googlebot Disallow: / User-agent: Mediapartners-Google Disallow:
التحكّم في سرعة الزحف
يدخل كل زاحف من Google إلى المواقع الإلكترونية لغرض محدّد وبمعدّلات زحف مختلفة. ويستخدم محرّك بحث Google الخوارزميات لتحديد معدّل الزحف المثالي لكل موقع إلكتروني. إذا كان زاحف Google يزحف إلى موقعك الإلكتروني بمعدّل مرتفع، يمكنك خفض معدّل الزحف.
برامج زحف من Google تمت إزالتها
إنّ برامج الزحف التالية من Google لم تعُد قيد الاستخدام ويتم ذكرها هنا لأغراض مرجعية فقط.
برامج زحف من Google تمت إزالتها | |||||
---|---|---|---|---|---|
Duplex على الويب |
كان وكيل المستخدم متوافقًا مع خدمة "Duplex على الويب".
|
||||
تقنيّة Web Light |
يتم التأكّد من توفّر عنوان
|
||||
AdsBot Mobile Web |
يفحص جودة الإعلانات على صفحات الويب في هواتف iPhone.
وهو يتجاهل وكيل المستخدم العام (
|
||||
Mobile Apps Android |
يفحص جودة الإعلانات على صفحات تطبيقات Android.
وهو يلتزم بقواعد
|
||||
Google Favicon |
|