دمج عناوين URL المكرّرة

إذا كان لديك صفحة واحدة يمكن الوصول إليها من خلال عدة عناوين URL أو كان لديك صفحات مختلفة تتضمّن محتوًى مماثلاً (على سبيل المثال، صفحة تحتوي على إصدار مخصّص للأجهزة الجوّالة وإصدار مخصّص لأجهزة الكمبيوتر)، يرى محرك البحث Google تلك الصفحات على أنها إصدارات مكرّرة من الصفحة نفسها. سيختار محرك البحث Google عنوان URL واحدًا ليكون الإصدار الأساسي ويزحف إليه، وستُعدّ جميع عناوين URL الأخرى عناوين مكرّرة وسيتم الزحف إليها بمعدّل أقل.

وإذا لم تُعلم Google بعنوان URL الأساسي بوضوح، سيحدّد هو الخيار المناسب نيابة عنك، وقد يعتبر الخيارين متساويين في الترجيح، ما قد يؤدي إلى سلوك غير مرغوب فيه، كما هو موضّح في القسم لماذا يجب اختيار عنوان URL أساسي؟

ما المقصود بعنوان URL الأساسي؟

عنوان URL الأساسي هو عنوان URL للصفحة التي يرى محرك البحث Google أنها الأكثر تمثيلاً من بين مجموعة من الصفحات المكرّرة على موقعك الإلكتروني. وعلى سبيل المثال، إذا كان لديك عناوين URL للصفحة نفسها (مثل: example.com?dress=1234 وexample.com/dresses/1234)، سيختار محرك البحث Google عنوان URL واحدًا فقط بصفته أساسيًا. وتجدر الإشارة إلى أن هذا الأمر ينطبق على الصفحات المماثلة والمتطابقة تمامًا على حد سواء، أي أن التغييرات البسيطة في ترتيب صفحات القوائم أو فلترتها لا تجعل الصفحة فريدة (مثل، الترتيب حسب السعر أو الفلترة حسب لون العنصر).

ومن الوارد أن يكون عنوان URL الأساسي على نطاق مختلف عن ذلك الخاص بصفحة مكرَّرة.

مزيد من التفاصيل

عندما يفهرس Googlebot موقعًا إلكترونيًا، يحاول تحديد المحتوى الأساسي في كل صفحة. وإذا عثر Googlebot على صفحات متعددة تبدو متماثلة على الموقع الإلكتروني نفسه، يختار الصفحة التي يعتقد أنها الأكثر اكتمالاً ونفعًا ويحددها على أنها الصفحة الأساسية. وسيزحف محرك البحث Google إلى الصفحة الأساسية بشكلٍ منتظم، بينما يزحف إلى الصفحات المكرّرة بمعدّل أقل للتخفيف من حِمل الزحف على موقعك الإلكتروني.

ويختار محرك البحث Google الصفحة الأساسية استنادًا إلى عدة عوامل (أو إشارات)، مثل ما إذا كان يتم عرض الصفحة من خلال http أو https وجودة الصفحة وتوفّر عنوان URL في ملف Sitemap، بالإضافة إلى أيّ تصنيف rel=canonical. ويمكنك إبلاغ محرك البحث Google بالصفحة التي تفضّلها باستخدام هذه الطرق، ولكنه قد يختار صفحة أساسية أخرى لأسباب مختلفة.

لا تُعدّ نُسخ اللغات المختلفة لصفحة واحدة نُسخًا مكرّرة إلّا إذا كان المحتوى الرئيسي باللغة نفسها (أي إذا لم تتمّ ترجمة سوى الرأس والتذييل وغيرهما من النصوص غير المهمة وظلّ المَتن كما هو، حينئذٍ تُعدّ الصفحات مكرّرة).

يستخدم محرك البحث Google الصفحات الأساسية كمصادر رئيسية لتقييم المحتوى والجودة. وتشير عادةً نتيجة البحث من Google إلى الصفحة الأساسية إلّا إذا كان من الواضح أنّ إحدى النُسخ المكرّرة تناسب المستخدم على نحو أفضل: على سبيل المثال، من المرجّح أن تشير نتيجة البحث إلى صفحة متوافقة مع الأجهزة الجوَّالة إذا كان الجهاز المستخدَم هو جهازًا جوّالاً حتى إذا تم تمييز الصفحة المتوافقة مع أجهزة الكمبيوتر على أنها الصفحة الأساسية.

لماذا يحتوي موقعي الإلكتروني على صفحات مشابهة/مكرّرة؟

هناك أسباب وجيهة تجعل موقعك يحتوي على عناوين URL مختلفة تشير إلى الصفحة نفسها، أو يشتمل على صفحات مكرّرة أو مشابهة جدًا في عناوين URL مختلفة. وفي ما يلي الأسباب الأكثر شيوعًا:

  • للتوافق مع أنواع الأجهزة المتعددة:
    https://example.com/news/koala-rampage
    https://m.example.com/news/koala-rampage
    https://amp.example.com/news/koala-rampage
  • لتفعيل عناوين URL ديناميكية لعناصر مثل معلَمات البحث أو معرّفات الجلسات:
    https://www.example.com/products?category=dresses&color=green
    https://example.com/dresses/cocktail?gclid=ABCD
    https://www.example.com/dresses/green/greendress.html
  • إذا كان نظام مدوّنتك يحفظ عناوين URL متعددة تلقائيًا عند إضافة المشاركة نفسها ضمن أقسام متعددة.
    https://blog.example.com/dresses/green-dresses-are-awesome/
    https://blog.example.com/green-things/green-dresses-are-awesome/
  • إذا تم إعداد الخادم لعرض المحتوى نفسه للصيغ المزوَّدة بالبادئة www أو بدونها، أو التي تتضمّن http/https:
    http://example.com/green-dresses
    https://example.com/green-dresses
    http://www.example.com/green-dresses
    
  • إذا تم نسخ المحتوى الذي تقدّمه على مدوّنة لمشاركته على مواقع أخرى ضمن هذه النطاقات جزئيًّا أو كليًّا:
    https://news.example.com/green-dresses-for-every-day-155672.html (المشاركة المقتبسة) https://blog.example.com/dresses/green-dresses-are-awesome/3245/ (المشاركة الأصلية)

لماذا يجب اختيار عنوان URL أساسي؟

هناك عدد من الأسباب التي قد تدفعك إلى الاختيار الصريح لصفحة أساسية ضمن مجموعة من الصفحات المكرّرة/المشابهة:

  • تحديد عنوان URL الذي تريد أن يشاهده المستخدمون في نتائج البحث: ربما تفضّل أن يصل المستخدمون إلى صفحة الفساتين الخضراء من خلال https://www.example.com/dresses/green/greendress.html بدلاً من https://example.com/dresses/cocktail?gclid=ABCD.
  • دمج إشارات الروابط للصفحات المشابهة أو المكرّرة: يساعد هذا الإجراء محرّكات البحث في دمج المعلومات المتوفرة لديها بخصوص عناوين URL الفردية (مثل الروابط المؤدية إليها) في عنوان URL واحد مفضّل. بعبارة أخرى، يتم دمج الروابط التي تؤدي إلى http://example.com/dresses/cocktail?gclid=ABCD من مواقع إلكترونية أخرى مع الروابط التي تؤدي إلى https://www.example.com/dresses/green/greendress.html.
  • تبسيط مقاييس التتبّع لمنتج واحد/موضوع واحد: مع توفّر مجموعة متنوعة من عناوين URL، قد يصعب الحصول على مقاييس موحّدة لنوع محدد من المحتوى.
  • إدارة المحتوى المقتبَس: إذا كنت تشارك المحتوى الخاص بك لنشره على نطاقات أخرى، ننصحك بالتأكد من ظهور عنوان URL المفضّل لديك في نتائج البحث.
  • تجنُّب قضاء وقت في الزحف إلى الصفحات المكرّرة: السيناريو الأمثل هو أن يستفيد Googlebot إلى أقصى حدّ من موقعك الإلكتروني، لذا من الأفضل له أن يقضي الوقت في الزحف إلى صفحات جديدة (أو معدّلة) على موقعك الإلكتروني بدلاً من الزحف إلى الإصدارات المخصّصة لأجهزة الكمبيوتر والإصدارات المخصّصة للأجهزة الجوّالة من الصفحات نفسها.

ما عنوان URL الذي يعتبره محرّك البحث Google أساسيًا؟

يمكنك استخدام أداة فحص عنوان URL لمعرفة الصفحة التي يعتبرها Google أساسية. ويُرجى العلم بأنه حتى في حال تحديد صفحة أساسية بوضوح، قد يختار محرك البحث Google صفحة أساسية مختلفة لأسباب متعددة، مثل الأداء أو المحتوى.

تحديد المشاكل وحلّها

إذا كان عنوان URL الأساسي في موقع إلكتروني لا تملكه، لن تتمكّن من الاطّلاع على أي من الزيارات في الصفحة المكرّرة. في ما يلي بعض الأسباب الشائعة لوجود عنوان URL أساسي في موقع إلكتروني منفصل:

  • صيغ اللغة المحددة على نحو غير سليم: إذا كانت لديك عدة مواقع إلكترونية تعرض محتوى متماثلاً تمت ترجمته ليصل إلى المستخدمين حول العالم، تأكَّد من اتّباع إرشاداتنا بشأن المواقع الإلكترونية المترجمة.
  • العلامات الأساسية غير صحيحة: قد تستخدم بعض أنظمة إدارة المحتوى أو المكوّنات الإضافية لأنظمة إدارة المحتوى أساليب تحديد العنوان الأساسي بشكل غير صحيح للتوجيه إلى عناوين URL على مواقع إلكترونية خارجية. لذلك، عليك التحقق من المحتوى الخاص بك لمعرفة ما إذا كان ذلك منطبقًا عليك. إذا كان موقعك الإلكتروني يشير إلى تفضيل غير متوقّع لعنوان URL أساسي، نتيجة استخدام غير صحيح لعلامات rel="canonical" أو عملية إعادة توجيه 301 مثلاً، ننصحك بإصلاح هذه المشكلة مباشرةً.
  • الخوادم التي تم إعدادها بشكل غير صحيح: قد يؤدي ضبط الخادم الذي يستضيف موقعك الإلكتروني بشكل غير صحيح إلى اختيار غير متوقّع لعنوان URL في عدة نطاقات. مثلاً:
    • قد يتم إعداد الخادم بشكل غير صحيح، فيعرض محتوى من a.com كاستجابة لطلب عرض عنوان URL على b.com.
    • قد يعرض خادمان مختلفان على الويب صفحات soft 404 متطابقة يتعذّر على محرك البحث Google تحديدها كصفحات تحتوي على أخطاء.
  • الاستيلاء على الصفحات باستخدام البرامج الضارة: تُدخل بعض الهجمات على المواقع الإلكترونية رموزًا تؤدي إلى عرض إعادة توجيه 301 من خلال HTTP أو تُدرج عنصر رابط rel="canonical" في عدة نطاقات في <head> HTML أو في عنوان HTTP، حيث يوجّه عنصر الرابط هذا عادةً إلى عنوان URL يستضيف برامج ضارة أو محتوى غير مرغوب فيه. وفي هذه الحالات، قد تختار الخوارزميات التي نستخدمها عنوان URL الضار أو غير المرغوب فيه بدلاً من عنوان URL في الموقع الإلكتروني الذي تم الاستيلاء عليه.
  • موقع إلكتروني مقلَّد: في بعض الحالات النادرة، قد تختار الخوارزميات التي نستخدمها عنوان URL من موقع إلكتروني خارجي يستضيف المحتوى الخاص بك بدون إذنك. إذا كنت تعتقد أنّ ثمة موقع إلكتروني آخر يعرض نسخة من المحتوى الخاص بك، ما يشكّل مخالفةً لقانون حقوق الطبع والنشر، يمكنك الاتصال بمضيف الموقع الإلكتروني لطلب إزالة هذا المحتوى. بالإضافة إلى ذلك، يمكنك أن تطلب من Google إزالة الصفحة التي تمثّل مخالفةً من نتائج البحث من خلال تقديم طلب بموجب قانون الألفية الجديدة لحقوق طبع ونشر المواد الرقمية.

تحديد صفحة أساسية

هناك بعض الطرق المختلفة لتحديد الصفحة الأساسية بين مجموعة صفحات مكرّرة، بناءً على استخدامك:

الأسلوب والوصف
الإرشادات العامة اتّبِع هذه الإرشادات في جميع أساليب تحديد عنوان URL الأساسي.
العلامة rel=canonical <link>

أضف علامة <link> في الرمز لجميع الصفحات المكرّرة، مع الإشارة إلى الصفحة الأساسية.

الإيجابيات:

  • إمكانية تعيين عدد غير محدود من الصفحات المكررة

السلبيات:

  • إمكانية الإضافة إلى حجم الصفحة
  • إمكانية ظهور صعوبة كبيرة في الحفاظ على التعيين في المواقع الإلكترونية الكبيرة أو المواقع الإلكترونية التي تتغير فيها عناوين URL كثيرًا
  • عدم الجدوى إلا مع صفحات HTML، وليس مع ملفات مثل ملفات PDF، وفي مثل هذه الحالات، يمكنك استخدام عنوان HTTP rel=canonical
عنوان HTTP rel=canonical

أرسِل عنوان rel=canonical في استجابة صفحتك.

الإيجابيات:

  • عدم زيادة حجم الصفحة
  • إمكانية تعيين عدد غير محدود من الصفحات المكررة

السلبيات:

  • إمكانية ظهور صعوبة كبيرة في الحفاظ على التعيين في المواقع الإلكترونية الكبيرة أو المواقع الإلكترونية التي تتغير فيها عناوين URL كثيرًا
ملف Sitemap

حدّد صفحاتك الأساسية في ملف sitemap.

الإيجابيات:

  • يسهل تطبيقها والحفاظ عليها، وخاصةً على المواقع الإلكترونية الكبيرة.

السلبيات:

  • يبقى على Googlebot تحديد النسخة المكرّرة المرتبطة بأي صفحات أساسية تشير إليها في ملف Sitemap.
  • إشارة أقل قوة إلى Googlebot مقارنةً بأسلوب ربط rel=canonical
إعادة التوجيه 301 استخدم عمليات إعادة التوجيه 301 لإخبار Googlebot بأن عنوان URL مُحدَّد مُعاد توجيهه يمثل إصدارًا أفضل لعنوان URL مُعيَّن، ولكن لا تستخدمها إلا عند إنهاء العمل بصفحة مكررة معيَّنة.
تنسيق AMP إذا كان أحد المتغيرات عبارة عن صفحة AMP، ستحتاج إلى اتباع إرشادات AMP للإشارة إلى الصفحة الأساسية ومتغير AMP.

نوصيك باستخدام أي من هذه الطرق، ولكن تجدر الإشارة إلى أنها جميعًا لا تُعد إلزامية. إذا لم تحدد عنوان URL أساسيًا، سنحدّد ما نعتقد أنه أفضل إصدار أو عنوان URL.

الإرشادات العامة

بالنسبة إلى جميع طرق تحديد عنوان URL الأساسي، اتّبع هذه الإرشادات العامة.

الإرشادات العامة

  • لا تستخدم ملف robots.txt لأغراض متعلقة بتحديد عنوان URL الأساسي.
  • لا تستخدم أداة إزالة عناوين URL لأغراض متعلقة بتحديد عناوين URL الأساسية، لأنها تزيل كل نُسخ عنوان URL من البحث.
  • لا تحدِّد عناوين URL مختلفة على أنها عناوين أساسية للصفحة ذاتها سواء باستخدام أساليب تحديد عنوان URL الأساسي نفسها أم أساليب مختلفة عنها (على سبيل المثال، لا تحدِّد عنوان URL في ملف Sitemap وعنوان URL مختلف للصفحة ذاتها باستخدام rel="canonical").
  • لا تستخدم العلامة الوصفية noindex كوسيلة لمنع اختيار صفحة أساسية. ويهدف هذا التوجيه إلى استبعاد الصفحة من الفهرس، وليس إلى إدارة اختيار الصفحة الأساسية.
  • حدِّد صفحة أساسية عند استخدام علامات hreflang. وحدِّد صفحة أساسية باللغة ذاتها أو بأفضل لغة بديلة ممكنة إذا لم تتوفر صفحة أساسية للغة ذاتها.

  • أنشِئ روابط إلى عنوان URL الأساسي وليس عنوان URL المكرّر أثناء الربط بموقعك الإلكتروني. ومن خلال إنشاء روابط بشكل متّسق تؤدي إلى عنوان URL الذي تعتبره أساسيًا، تساعد Google على فهم تفضيلاتك.

تفضيل HTTPS على HTTP لعناوين URL الأساسية

يفضّل محرك البحث Google صفحات HTTPS على صفحات HTTP المكافئة عند اختيار صفحات أساسية، باستثناء عندما تكون ثمة مشاكل أو إشارات متضاربة مثل ما يلي:

  • تتضمّن صفحة HTTPS شهادة طبقة مقابس آمنة (SSL) غير صالحة.
  • تحتوي صفحة HTTPS على تبعيات غير آمنة (بخلاف الصور).
  • تعيد صفحة HTTPS توجيه المستخدمين إلى صفحة HTTP أو من خلالها.
  • تتضمّن صفحة HTTPS رابط rel="canonical" يؤدي إلى صفحة HTTP.

علمًا أنّ أنظمتنا تفضّل صفحات HTTPS على صفحات HTTP بشكل تلقائي، يمكنك التأكّد من حدوث ذلك عن طريق تنفيذ أي من الإجراءات التالية:

  • إضافة عمليات إعادة توجيه من صفحة HTTP إلى صفحة HTTPS.
  • إضافة رابط rel="canonical" ينقل المستخدم من صفحة HTTP إلى صفحة HTTPS
  • تنفيذ سياسة HSTS

لمنع محرك البحث Google من جعل صفحة HTTP صفحة أساسية بشكلٍ خاطئ، يجب تجنب الممارسات التالية:

  • تجعلنا شهادات طبقة المقابس الآمنة (SSL) غير الصالحة وعمليات إعادة التوجيه من HTTPS إلى HTTP نفضل صفحة HTTP إلى حد كبير جدًا. ولا يمكن أن يلغي تنفيذ HSTS هذا التفضيل القوي.
  • تضمين صفحة HTTP في ملف Sitemap أو إدخالات hreflang بدلاً من إصدار HTTPS.
  • تنفيذ شهادة طبقة المقابس الآمنة (SSL)/طبقة النقل الآمنة (TLS) لصيغة المضيف غير الصحيحة: على سبيل المثال، example.com يعرض شهادة www.example.com. ويجب أن تتطابق الشهادة مع عنوان URL الكامل للموقع الإلكتروني أو أن تكون شهادة أحرف بدل يمكن استخدامها لنطاقات فرعية متعددة في أحد النطاقات.

للمستخدمين المتقدّمين فقط: الطلب من محرك البحث Google تجاهل المعلَمات الديناميكية

استخدِم التعامل مع المعلَمات لإبلاغ محرك البحث Google بالمعلَمات التي يجب تجاهلها أثناء الزحف. وقد يؤدي تجاهل معلَمات معيّنة إلى تقليل نسبة المحتوى المكرّر في فهرس Google وتعزيز إمكانية الزحف إلى موقعك الإلكتروني. على سبيل المثال، إذا اخترت تجاهل المعلَمة sessionid، سيعتبر Googlebot عنوانَي URL التاليين عنوانين مكرّرين:

  • https://www.example.com/dresses/green.php?sessionid=273749
  • https://www.example.com/dresses/green.php

طرق محدّدة

اختَر إحدى الطرق التالية لتحديد عنوان URL أساسي لعناوين URL المكرّرة أو صفحات مكرّرة/مشابهة.

تأكَّد من اتّباع الإرشادات العامة أعلاه في جميع الطرق.

يمكنك استخدام علامة <link> في قسم head من صفحة HTML للإشارة إلى أنّ الصفحة نسخة مكرّرة من صفحة أخرى.

لنفترض أنك تريد تحديد https://example.com/dresses/green-dresses كعنوان URL أساسي، علمًا أنّ مجموعة متنوعة من عناوين URL يمكنها الوصول إلى هذا المحتوى. يمكنك الإشارة إلى عنوان URL هذا كعنوان أساسي باتّباع الخطوات التالية:

  1. إضافة عنصر الرابط rel="canonical" إلى كل الصفحات المكرّرة: أضِف عنصر <link> مع السمة rel="canonical" إلى القسم <head> من الصفحات المكرّرة، للإشارة إلى الصفحة الأساسية، على النحو التالي:
    <link rel="canonical" href="https://example.com/dresses/green-dresses" />

  2. إذا كانت الصفحة الأساسية تحتوي على صيغة مخصّصة للأجهزة الجوّالة، أضِف رابط rel="alternate" إليها للإشارة إلى إصدار الصفحة المخصّص للأجهزة الجوّالة:
    <link rel="alternate" media="only screen and (max-width: 640px)" href="http://m.example.com/dresses/green-dresses">

  3. إضافة أي علامة hreflang أو عمليات إعادة توجيه أخرى مناسبة للصفحة

استخدام عنوان HTTP rel="canonical"

إذا كان بإمكانك إعداد الخادم، يمكنك استخدام عناوين HTTP التي تتضمّن rel="canonical" (بدلاً من علامات HTML) للإشارة إلى عنوان URL الأساسي للمستند المتوافق مع خدمة "بحث Google"، بما في ذلك المستندات غير HTML مثل ملفات PDF.

على سبيل المثال، إذا كنت تعرض ملفًا بتنسيق PDF على عدة عناوين URL، يمكنك إضافة عنوان HTTP يتضمّن rel="canonical" كما هو موضّح في المثال التالي لعناوين URL المكرّرة لإخبار Googlebot بعنوان URL الأساسي الخاص بملف PDF:

Link: <http://www.example.com/downloads/white-paper.pdf>; rel="canonical"

يتوافق محرك البحث Google في الوقت الحالي مع هذه الطريقة لنتائج بحث الويب فقط.

استخدام ملف Sitemap

اختَر عنوان URL أساسيًّا لكل صفحة من صفحاتك وأدرِجه في ملف Sitemap. وتكون جميع الصفحات المدرَجة في ملف Sitemap مقترَحة باعتبارها صفحات أساسية، وسيحدّد Googlebot الصفحات المكرّرة (إن وجدت) استنادًا إلى تشابه المحتوى.

نحن لا نضمن أننا سنعتبر عناوين URL المدرَجة في ملف Sitemap أساسية، ولكنها طريقة بسيطة لتعريف العناوين الأساسية في موقع إلكتروني كبير، وتشكّل ملفات Sitemap طريقةً مفيدةً لإخبار محرك البحث Google بالصفحات التي تعتبرها الأكثر الأهمية على موقعك الإلكتروني.

لا تضمِّن صفحات غير أساسية في ملف Sitemap. وعند استخدام ملف sitemap، حدِّد عناوين URL الأساسية فقط في خريطة الملف.

استخدام عمليات إعادة التوجيه 301 لعناوين URL المُستبعَدة

استخدم هذه الطريقة عندما تريد التخلص من الصفحات المكررة الحالية، ولكنك تحتاج إلى ضمان انتقال سلس قبل أن تستبعد عناوين URL القديمة.

لنفترض أنّ صفحتك يمكن الوصول إليها من خلال عدة طُرق:

  • https://example.com/home
  • https://home.example.com
  • https://www.example.com

اختَر أحد عناوين URL هذه كعنوان URL الأساسي، واستخدِم عمليات إعادة التوجيه 301 لتحويل الزيارات من عناوين URL الأخرى إلى عنوان URL المفضّل لديك. تُعدّ طريقة إعادة التوجيه 301 من جانب الخادم أفضل طريقة لضمان توجيه المستخدمين ومحركات البحث إلى الصفحة الصحيحة. يشير رمز الحالة 301 إلى أنه تم نقل إحدى الصفحات إلى مكان جديد بشكل دائم.

إذا كنت مشتركًا في خدمة استضافة المواقع الإلكترونية، ابحث عن المستندات المتعلقة بإعداد عمليات إعادة التوجيه 301.