تحديد عنوان URL الأساسي للصفحات المكرّرة واستخدام العلامة الأساسية

إذا كانت لديك صفحة واحدة يمكن الوصول إليها من خلال عدة عناوين URL أو كانت لديك صفحات مختلفة تتضمّن محتوًى مماثلاً (على سبيل المثال، صفحة تحتوي على إصدار مخصّص للأجهزة الجوّالة وإصدار مخصّص لأجهزة الكمبيوتر)، يرى محرّك بحث Google تلك الصفحات على أنّها إصدارات مكرّرة من الصفحة نفسها. سيختار محرك البحث Google عنوان URL واحدًا ليكون الإصدار الأساسي ويزحف إليه، وستُعتبر جميع عناوين URL الأخرى عناوين مكرّرة وسيتم الزحف إليها بمعدّل أقل.

إذا لم تُعلم محرّك بحث Google بعنوان URL الأساسي بوضوح، سيحدّد هو الخيار المناسب نيابةً عنك، أو قد يعتبر الخيارَين متساويَين في الترجيح، ما قد يؤدي إلى سلوك غير مرغوب فيه، كما هو موضّح في القسم لماذا يجب اختيار عنوان URL أساسي؟

يوضّح هذا المستند آلية تحديد عنوان URL الأساسي في "بحث Google"، وما إذا كنت بحاجة إلى تحديد عنوان URL أساسي وكيفية تحديد عنوان URL المفضّل لديك لمحرّك بحث Google.

ما هو عنوان URL الأساسي؟

عنوان URL الأساسي هو عنوان URL للصفحة التي يرى محرك بحث Google أنّها الأكثر دقةً من بين مجموعة من الصفحات المكرّرة على موقعك الإلكتروني. على سبيل المثال، إذا كانت لديك عدة عناوين URL للصفحة نفسها (example.com?dress=1234 وexample.com/dresses/1234)، يختار محرك بحث Google عنوان URL واحدًا فقط على أنه أساسي.

وليس ضروريًا أن تكون الصفحات متطابقة تمامًا، أي أن التغييرات البسيطة في ترتيب صفحات القوائم أو فلترتها لا تجعل الصفحة فريدة (على سبيل المثال، الترتيب حسب السعر أو الفلترة حسب لون العنصر). ويمكن أن يكون عنوان URL الأساسي ضمن نطاق مختلف عن عنوان URL مكرّر.

الآلية التي يتّبعها محرّك بحث Google لفهرسة عنوان URL الأساسي واختياره

عندما يفهرس محرّك بحث Google موقعًا إلكترونيًا، يحاول تحديد المحتوى الأساسي في كل صفحة. إذا عثر محرّك بحث Google على عدة صفحات تبدو متطابقة ضمن الموقع الإلكتروني نفسه، يختار الصفحة التي يعتقد أنّها الأكثر إفادةً واكتمالاً ويصنّفها على أنّها الصفحة الأساسية. يزحف محرّك بحث Google بانتظام إلى الصفحة الأساسية، بينما يزحف إلى الصفحات المكرّرة بمعدّل أقل، وذلك للتخفيف من حمل الزحف إلى موقعك الإلكتروني.

ويختار محرّك بحث Google الصفحة الأساسية استنادًا إلى عدة عوامل (أو إشارات)، مثل ما إذا كانت الصفحة معروضة على HTTP أو HTTPS وجودة الصفحة وتوفُّر عنوان URL في خريطة الموقع، بالإضافة إلى أي تصنيف rel=canonical. ويمكنك إبلاغ محرك البحث Google بالصفحة التي تفضّلها باستخدام هذه الطرق، ولكنه قد يختار صفحة أساسية أخرى لأسباب مختلفة.

لا تُعدّ النُسخ بلغات مختلفة لصفحة واحدة نُسخًا مكرّرة إلّا إذا كان المحتوى الرئيسي باللغة نفسها (أي إذا لم تتمّ ترجمة سوى الرأس والتذييل وغيرهما من النصوص غير المهمة وبقي النص الأساسي كما هو، عندها تُعدّ الصفحات مكرّرة).

يستخدم محرك البحث Google الصفحات الأساسية كمصادر رئيسية لتقييم المحتوى والجودة. وتشير عادةً نتيجة البحث من Google إلى الصفحة الأساسية، إلّا إذا كان من الواضح أنّ إحدى النُسخ المكرّرة تناسب المستخدم على نحو أفضل. على سبيل المثال، من المرجّح أن تشير نتيجة البحث إلى صفحة متوافقة مع الأجهزة الجوّالة إذا كان الجهاز المستخدَم هو جهازًا جوّالاً حتى إذا تم تصنيف الصفحة المتوافقة مع أجهزة الكمبيوتر على أنها الصفحة الأساسية.

أسباب ظهور صفحات مماثلة أو مكرّرة

هناك أسباب وجيهة تبرّر احتواء موقعك الإلكتروني على عناوين URL مختلفة تشير إلى الصفحة نفسها أو على صفحات مكرّرة أو متشابهة جدًا ضمن عناوين URL مختلفة. وفي ما يلي الأسباب الأكثر شيوعًا:

  • التوافق مع عدة أنواع من الأجهزة:
    https://example.com/news/koala-rampage
    https://m.example.com/news/koala-rampage
    https://amp.example.com/news/koala-rampage
  • تفعيل عناوين URL ديناميكية لعناصر مثل معلَمات الترتيب أو الفلترة أو أرقام تعريف الجلسات:
    https://www.example.com/products?category=dresses&color=green
    https://example.com/dresses/cocktail?gclid=ABCD
    https://www.example.com/dresses/green/greendress.html
  • إذا كان نظام مدوّنتك يحفظ عدة عناوين URL تلقائيًا عند إضافة المشاركة نفسها ضمن أقسام متعددة:
    https://blog.example.com/dresses/green-dresses-are-awesome/
    https://blog.example.com/green-things/green-dresses-are-awesome/
  • إذا تم إعداد الخادم لعرض المحتوى نفسه للصيغ المزوّدة بالبادئة www أو غير المزوّدة بها، وللصيغ التي تتضمّن منفذ بروتوكول http أو https :
    https://example.com/green-dresses
    https://example.com/green-dresses
    https://www.example.com/green-dresses
    https://example.com:80/green-dresses
    https://example.com:443/green-dresses
  • إذا كنت توفّر محتوى على مدوّنة لمشاركته على مواقع إلكترونية أخرى وتم نسخه كلّه أو جزء منه على هذه النطاقات:
    https://news.example.com/green-dresses-for-every-day-155672.html (المشاركة المقتبسة) https://blog.example.com/dresses/green-dresses-are-awesome/3245/ (المشاركة الأصلية)

لماذا يجب اختيار عنوان URL أساسي؟

هناك عدة أسباب قد تدفعك إلى اختيار صفحة أساسية بشكل صريح ضمن مجموعة من الصفحات المكرّرة أو المتشابهة:

  • تحديد عنوان URL الذي تريد أن يراه المستخدمون في نتائج البحث: ربما تفضّل أن يصل المستخدمون إلى صفحة الفساتين الخضراء من خلال https://www.example.com/dresses/green/greendress.html بدلاً من https://example.com/dresses/cocktail?gclid=ABCD.
  • دمج إشارات الروابط للصفحات المشابهة أو المكرّرة: يساعد هذا الإجراء محرّكات البحث في دمج المعلومات المتوفرة لديها بخصوص عناوين URL الفردية (مثل الروابط المؤدية إليها) في عنوان URL واحد مفضّل. بعبارة أخرى، يتم دمج الروابط التي تؤدي إلى https://example.com/dresses/cocktail?gclid=ABCD من مواقع إلكترونية أخرى مع الروابط التي تؤدي إلى https://www.example.com/dresses/green/greendress.html.
  • تبسيط مقاييس التتبّع لمنتج واحد أو موضوع واحد: مع توفّر مجموعة متنوعة من عناوين URL، قد يصعب الحصول على مقاييس موحّدة لنوع محدد من المحتوى.
  • إدارة المحتوى المقتبَس: إذا كنت تشارك المحتوى الخاص بك لنشره على نطاقات أخرى، ننصحك بالتأكد من ظهور عنوان URL المفضّل لديك في نتائج البحث.
  • تجنُّب قضاء وقت في الزحف إلى الصفحات المكرّرة: السيناريو الأمثل هو أن يستفيد Googlebot إلى أقصى حدّ من موقعك الإلكتروني، لذا من الأفضل له أن يقضي الوقت في الزحف إلى صفحات جديدة (أو معدّلة) على موقعك الإلكتروني بدلاً من الزحف إلى الإصدارات المخصّصة لأجهزة الكمبيوتر والإصدارات المخصّصة للأجهزة الجوّالة من الصفحات نفسها.

معرفة الصفحة التي يعتبرها محرّك البحث Google أساسية

يمكنك استخدام أداة فحص عنوان URL لمعرفة الصفحة التي يعتبرها محرك بحث Google أساسية. حتى إذا حددت صفحة أساسية بشكل واضح، قد يختار محرك بحث Google صفحة أساسية مختلفة لأسباب متعددة، مثل الأداء أو المحتوى.

تحديد صفحة أساسية

لتحديد عنوان URL أساسي لعناوين URL مكرّرة أو صفحات متشابهة، اختَر إحدى الطرق التالية. ننصحك باستخدام أي من هذه الطرق، ولكن يُرجى العِلم بأنها كلّها ليست إلزامية. وإذا لم تحدّد عنوان URL أساسيًا، سنحدّد ما نعتقد أنه أفضل نسخة أو عنوان URL. وتأكَّد من اتّباع الإرشادات العامة.

الأسلوب والوصف
العلامة rel=canonical <link>

أضف علامة <link> في الرمز لجميع الصفحات المكرّرة للإشارة إلى الصفحة الأساسية.

الإيجابيات:
  • إمكانية ربط عدد غير محدود من الصفحات المكرّرة

السلبيات:

  • إمكانية الإضافة إلى حجم الصفحة
  • احتمال مواجهة صعوبة كبيرة في الحفاظ على الربط في المواقع الإلكترونية الكبيرة أو المواقع الإلكترونية التي تتغير فيها عناوين URL كثيرًا
  • عدم إمكانية استخدام هذه العلامة إلا مع صفحات HTML، وليس مع ملفات مثل ملفات PDF، وفي مثل هذه الحالات، يمكنك استخدام عنوان HTTP يتضمن السمة rel=canonical
عنوان HTTP rel=canonical

أرسِل عنوان rel=canonical في استجابة صفحتك.

الإيجابيات:

  • عدم زيادة حجم الصفحة
  • إمكانية ربط عدد غير محدود من الصفحات المكرّرة

السلبيات:

  • احتمال مواجهة صعوبة كبيرة في الحفاظ على الربط في المواقع الإلكترونية الكبيرة أو المواقع الإلكترونية التي تتغير فيها عناوين URL كثيرًا
خريطة الموقع

حدّد صفحاتك الأساسية في ملف Sitemap.

الإيجابيات:

  • يسهل تطبيقها والحفاظ عليها، وخاصةً على المواقع الإلكترونية الكبيرة.

السلبيات:

  • يبقى على محرّك بحث Google تحديد النسخة المكرّرة المرتبطة بأي صفحات أساسية تتم الإشارة إليها في خريطة الموقع.
  • تقدّم هذه الطريقة إشارة أقل قوّة إلى محرّك بحث Google مقارنةً بأسلوب ربط rel=canonical.
إعادة توجيه 301 يمكنك استخدام عمليات إعادة التوجيه 301 للإشارة إلى Googlebot بأنّه يتوفّر عنوان URL مُعاد توجيهه يمثّل إصدارًا أفضل من عنوان URL آخر معيّن. ننصحك بعدم استخدام هذه العمليات إلّا عند إيقاف صفحة مكرّرة معيّنة نهائيًا.
صيغة AMP إذا كانت إحدى الصيغ عبارة عن صفحة AMP، اتّبِع إرشادات AMP للإشارة إلى الصفحة الأساسية وصيغة AMP.

الإرشادات العامة

عند اتّباع أي طريقة من طرق تحديد عنوان URL الأساسي، اتّبِع هذه الإرشادات العامة:

  • لا تستخدم ملف robots.txt لأغراض متعلقة بتحديد عناوين URL الأساسية.
  • لا تستخدم أداة إزالة عناوين URL لأغراض متعلقة بتحديد عناوين URL الأساسية، لأنّها تزيل كل إصدارات عنوان URL من &quot;بحث Google&quot;.
  • لا تحدّد عناوين URL مختلفة على أنّها عناوين أساسية للصفحة نفسها، سواء باستخدام أساليب متطابقة لتحديد عنوان URL الأساسي أم أساليب مختلفة (على سبيل المثال، لا تحدّد عنوان URL معيّنًا في خريطة الموقع وعنوان URL مختلفًا للصفحة نفسها باستخدام rel="canonical").
  • لا تستخدِم علامة noindex كوسيلة لمنع اختيار صفحة أساسية. وتهدف هذه القاعدة إلى استبعاد الصفحة من الفهرس، وليس إلى إدارة كيفية اختيار الصفحة الأساسية.
  • حدِّد صفحة أساسية عند استخدام علامات hreflang. وحدِّد صفحة أساسية باللغة ذاتها أو بأفضل لغة بديلة ممكنة إذا لم تتوفر صفحة أساسية للغة ذاتها.

  • أنشِئ روابط تؤدي إلى عنوان URL الأساسي وليس إلى عنوان URL المكرّر أثناء الربط بموقعك الإلكتروني. ومن خلال إنشاء روابط بشكل متّسق تؤدي إلى عنوان URL الذي تعتبره أساسيًا، يمكنك مساعدة محرك البحث Google على فهم خيارك المفضّل.

تفضيل HTTPS على HTTP لعناوين URL الأساسية

يفضّل محرك البحث Google صفحات HTTPS على صفحات HTTP المكافئة عند اختيار صفحات أساسية، باستثناء عندما تكون ثمة مشاكل أو إشارات متضاربة مثل ما يلي:

  • تتضمن صفحة HTTPS شهادة طبقة مقابس آمنة (SSL) غير صالحة.
  • تحتوي صفحة HTTPS على تبعيات غير آمنة (بخلاف الصور).
  • تعيد صفحة HTTPS توجيه المستخدمين إلى صفحة HTTP أو من خلالها.
  • تتضمّن صفحة HTTPS علامة link rel="canonical" يؤدي إلى صفحة HTTP.

علمًا أنّ أنظمتنا تفضّل صفحات HTTPS على صفحات HTTP بشكل تلقائي، يمكنك ضمان التزام الأنظمة بذلك عن طريق اتّباع أيٍّ من الإجراءات التالية:

  • إضافة عمليات إعادة توجيه من صفحة HTTP إلى صفحة HTTPS
  • إضافة علامة link rel="canonical" تؤدّي من صفحة HTTP إلى صفحة HTTPS
  • تنفيذ سياسة HSTS

لمنع محرك البحث Google من اختيار صفحة HTTP كصفحة أساسية بشكلٍ خاطئ، تجنَّب الممارسات التالية:

  • تجنَّب شهادات بروتوكول أمان طبقة النقل (TLS) أو طبقة المقابس الآمنة غير الصالحة وعمليات إعادة التوجيه من HTTPS إلى HTTP، لأنها تجعل محرّك بحث Google يفضّل HTTP إلى حد كبير جدًا. ولا يمكن أن يلغي تنفيذ HSTS هذا التفضيل القوي.
  • تجنَّب تضمين صفحة HTTP في ملف Sitemap أو إدخالات hreflang بدلاً من إصدار HTTPS.
  • تجنَّب تطبيق شهادة طبقة المقابس الآمنة أو بروتوكول أمان طبقة النقل على صيغة المضيف غير الصحيحة، على سبيل المثال، عن طريق عرض شهادة www.example.com على example.com. يجب أن تتطابق الشهادة مع عنوان URL الكامل للموقع الإلكتروني أو أن تكون شهادة أحرف بدل يمكن استخدامها لنطاقات فرعية متعددة في أحد النطاقات.

تُستخدم علامة الرابط rel=”canonical”‎ (علامة أساسية) في قسم العنوان في ملف HTML للإشارة إلى أنّ الصفحة تتداخل مع صفحة أخرى. للإشارة إلى أنّ الصفحة نسخة مكرّرة عن صفحة أخرى، يمكنك استخدام علامة <link> في قسم head من ترميز HTML.

لنفترض أنّك تريد تحديد https://example.com/dresses/green-dresses كعنوان URL أساسي، علمًا أنّ مجموعة متنوعة من عناوين URL يمكنها الوصول إلى هذا المحتوى، يمكنك الإشارة إلى عنوان URL هذا كعنوان أساسي باتّباع الخطوات التالية:

  1. أضِف علامة رابط rel="canonical" إلى كل الصفحات المكرّرة.

    أضِف عنصر <link> مع السمة rel="canonical" إلى قسم <head> في الصفحات المكرّرة للإشارة إلى الصفحة الأساسية. مثلاً:

    <link rel="canonical" href="https://example.com/dresses/green-dresses" />
  2. إذا كانت الصفحة الأساسية تحتوي على صيغة مخصّصة للأجهزة الجوّالة، أضِف علامة link rel="alternate" إليها للإشارة إلى إصدار الصفحة المخصّص للأجهزة الجوّالة:
    <link rel="alternate" media="only screen and (max-width: 640px)"  href="https://m.example.com/dresses/green-dresses">
  3. أضِف أي علامة hreflang أو عمليات إعادة توجيه أخرى مناسبة للصفحة.

استخدِم المسارات المطلقة بدلاً من المسارات النسبية مع العلامة rel="canonical" link.

مثال جيد: https://www.example.com/dresses/green/greendress.html

مثال غير صالح: /dresses/green/greendress.html

إذا كنت تستخدم لغة JavaScript لإضافة علامة رابط rel="canonical"، تأكَّد من إدخال علامة الرابط الأساسية على النحو الصحيح.

استخدام عنوان HTTP يتضمن السمة rel="canonical"

إذا كان بإمكانك إعداد خادمك، يمكنك استخدام عنوان HTTP يتضمن السمة rel="canonical" (بدلاً من علامة HTML) للإشارة إلى عنوان URL الأساسي لمستند متوافق مع "بحث Google"، بما في ذلك المستندات التي ليست بتنسيق HTML، مثل ملفات PDF.

يتوافق محرك البحث Google في الوقت الحالي مع هذه الطريقة لنتائج بحث الويب فقط.

إذا كنت تعرض ملفًا بتنسيق PDF من خلال عدة عناوين URL، يمكنك إضافة عنوان HTTP يتضمن السمة rel="canonical" لإعلام Googlebot بعنوان URL الأساسي الخاص بملف PDF:

Link: <https://www.example.com/downloads/white-paper.pdf>; rel="canonical"

إن اقتراحات عنوان HTTP rel="canonical" هي نفسها كتلك الخاصة بعلامة rel="canonical" link. ووفقًا لمعيار RFC2616، يمكنك استخدام علامات الاقتباس المزدوجة فقط في عنوان HTTP rel="canonical".

استخدام ملف Sitemap

اختَر عنوان URL أساسيًا لكل صفحة من صفحاتك وأرسله في خريطة الموقع. يتم اقتراح جميع الصفحات المدرَجة في خريطة الموقع على أنّها صفحات أساسية، ويحدّد محرّك بحث Google الصفحات المكرّرة (إذا وُجدَت) استنادًا إلى تشابه المحتوى.

نحن لا نضمن أنّنا سنعتبر عناوين URL المدرَجة في خريطة الموقع على أنّها أساسية، ولكنّ خرائط الموقع هي طريقة بسيطة لتعريف العناوين الأساسية في موقع إلكتروني كبير، وهي مفيدة لإبلاغ محرّك بحث Google بالصفحات التي تعتبرها الأكثر أهمية على موقعك الإلكتروني.

لا تُضمِّن صفحات غير أساسية في خريطة موقع. وإذا كنت تستخدم خريطة موقع، حدِّد فيها عناوين URL الأساسية فقط.

استخدام عمليات إعادة التوجيه 301 لعناوين URL التي تمت إزالتها

استخدِم هذه الطريقة للتخلص من الصفحات المكرّرة الحالية مع ضمان عملية انتقال سلسة قبل إزالة عناوين URL القديمة.

لنفترض أنه يمكن الوصول إلى صفحتك من خلال عدة طرق:

  • https://example.com/home
  • https://home.example.com
  • https://www.example.com

اختَر أحد عناوين URL هذه كعنوان URL الأساسي، واستخدِم عمليات إعادة التوجيه 301 لتحويل الزيارات من عناوين URL الأخرى إلى عنوان URL الذي تفضّله. تُعدّ عملية إعادة التوجيه 301 من جانب الخادم أفضل طريقة لضمان توجيه المستخدمين ومحركات البحث إلى الصفحة الصحيحة. ويشير رمز الحالة 301 إلى أنّه تم نقل إحدى الصفحات إلى مكان جديد بشكل دائم.

إذا كنت مشتركًا في خدمة استضافة للمواقع الإلكترونية، ابحث عن المستندات المتعلقة بإعداد عمليات إعادة التوجيه 301.

تحديد المشاكل وحلّها

إذا كان عنوان URL الأساسي في موقع إلكتروني لا تملكه، لن تتمكّن من الاطّلاع على أي من الزيارات في الصفحة المكرّرة. في ما يلي بعض الأسباب الشائعة التي قد تؤدي إلى توفّر عنوان URL أساسي في موقع إلكتروني منفصل:

  • صيغ اللغة المحددة على نحو غير صحيح: إذا كانت لديك عدة مواقع إلكترونية تعرض محتوًى مشابهًا تمت ترجمته ليصل إلى المستخدمين في كل أنحاء العالم، تأكَّد من اتّباع إرشاداتنا بشأن المواقع الإلكترونية المترجمة.
  • العلامات الأساسية غير الصحيحة: قد تستخدم بعض أنظمة إدارة المحتوى (CMS) أو المكوّنات الإضافية لأنظمة إدارة المحتوى أساليب تحديد العنوان الأساسي بشكل غير صحيح للتوجيه إلى عناوين URL على مواقع إلكترونية خارجية. لذلك، عليك التحقق من المحتوى الخاص بك لمعرفة ما إذا كان ذلك منطبقًا عليك. إذا كان موقعك الإلكتروني يشير إلى خيار مفضّل غير متوقّع لعنوان URL أساسي نتيجة استخدام غير صحيح لعلامة rel="canonical" أو عملية إعادة توجيه 301 مثلاً، ننصحك بإصلاح هذه المشكلة مباشرةً.
  • الخوادم التي تم إعدادها بشكل غير صحيح: قد تؤدي عملية الإعداد غير الصحيحة للخادم الذي يستضيف موقعك الإلكتروني إلى اختيار غير متوقّع لعنوان URL في عدة نطاقات. مثلاً:
    • قد يتم إعداد الخادم بشكل غير صحيح، فيعرض محتوى من a.com كاستجابة لطلب عرض عنوان URL على b.com.
    • قد يعرض خادمان مختلفان على الويب صفحات soft 404 متطابقة يتعذّر على محرك بحث Google تحديدها على أنها تحتوي على أخطاء.
  • اختراق الصفحات باستخدام البرامج الضارة: تُدخل بعض الهجمات على المواقع الإلكترونية رموزًا تؤدي إلى عرض إعادة توجيه 301 من خلال HTTP أو تُدرج علامة رابط rel="canonical" على النطاقات المختلفة في <head> لملف HTML أو في عنوان HTTP، حيث يوجّه عنصر الرابط هذا عادةً إلى عنوان URL يستضيف برامج ضارة أو محتوًى غير مرغوب فيه. وفي هذه الحالات، قد تختار خوارزمياتنا عنوان URL الضار أو غير المرغوب فيه بدلاً من عنوان URL المتوفّر في الموقع الإلكتروني الذي تم اختراقه.
  • موقع إلكتروني مقلَّد: في بعض الحالات النادرة، قد تختار خوارزمياتنا عنوان URL من موقع إلكتروني خارجي يستضيف المحتوى الخاص بك بدون إذنك. إذا كنت تعتقد أنّ ثمة موقع إلكتروني آخر يعرض نسخة من المحتوى الخاص بك بما يخالف قانون حقوق الطبع والنشر، يمكنك التواصل مع مضيف الموقع الإلكتروني لطلب إزالة هذا المحتوى. بالإضافة إلى ذلك، يمكنك أن تطلب من Google إزالة الصفحة التي تمثل انتهاكًا لحقوق الطبع والنشر من نتائج البحث من خلال تقديم طلب بموجب قانون الألفية الجديدة لحقوق طبع ونشر المواد الرقمية.