تحديد عنوان URL الأساسي للصفحات المكرّرة واستخدام العلامة الأساسية
إذا كانت لديك صفحة واحدة يمكن الوصول إليها من خلال عدة عناوين URL أو كانت لديك صفحات مختلفة تتضمّن محتوًى مماثلاً (على سبيل المثال، صفحة تحتوي على إصدار مخصّص للأجهزة الجوّالة وإصدار مخصّص لأجهزة الكمبيوتر)، يرى محرّك بحث Google تلك الصفحات على أنّها إصدارات مكرّرة من الصفحة نفسها. سيختار محرك البحث Google عنوان URL واحدًا ليكون الإصدار الأساسي ويزحف إليه، وستُعتبر جميع عناوين URL الأخرى عناوين مكرّرة وسيتم الزحف إليها بمعدّل أقل.
إذا لم تُعلم محرّك بحث Google بعنوان URL الأساسي بوضوح، سيحدّد هو الخيار المناسب نيابةً عنك، أو قد يعتبر الخيارَين متساويَين في الترجيح، ما قد يؤدي إلى سلوك غير مرغوب فيه، كما هو موضّح في القسم لماذا يجب اختيار عنوان URL أساسي؟
يوضّح هذا المستند آلية تحديد عنوان URL الأساسي في "بحث Google"، وما إذا كنت بحاجة إلى تحديد عنوان URL أساسي وكيفية تحديد عنوان URL المفضّل لديك لمحرّك بحث Google.
ما هو عنوان URL الأساسي؟
عنوان URL الأساسي هو عنوان URL للصفحة التي يرى محرك بحث Google أنّها الأكثر دقةً
من بين مجموعة من الصفحات المكرّرة على موقعك الإلكتروني. على سبيل المثال، إذا كانت لديك عدة عناوين URL للصفحة نفسها
(example.com?dress=1234
وexample.com/dresses/1234
)، يختار محرك بحث Google عنوان URL واحدًا فقط على أنه أساسي.
وليس ضروريًا أن تكون الصفحات متطابقة تمامًا، أي أن التغييرات البسيطة في ترتيب صفحات القوائم أو فلترتها لا تجعل الصفحة فريدة (على سبيل المثال، الترتيب حسب السعر أو الفلترة حسب لون العنصر). ويمكن أن يكون عنوان URL الأساسي ضمن نطاق مختلف عن عنوان URL مكرّر.
الآلية التي يتّبعها محرّك بحث Google لفهرسة عنوان URL الأساسي واختياره
عندما يفهرس محرّك بحث Google موقعًا إلكترونيًا، يحاول تحديد المحتوى الأساسي في كل صفحة. إذا عثر محرّك بحث Google على عدة صفحات تبدو متطابقة ضمن الموقع الإلكتروني نفسه، يختار الصفحة التي يعتقد أنّها الأكثر إفادةً واكتمالاً ويصنّفها على أنّها الصفحة الأساسية. يزحف محرّك بحث Google بانتظام إلى الصفحة الأساسية، بينما يزحف إلى الصفحات المكرّرة بمعدّل أقل، وذلك للتخفيف من حمل الزحف إلى موقعك الإلكتروني.
ويختار محرّك بحث Google الصفحة الأساسية استنادًا إلى عدة عوامل (أو إشارات)، مثل ما إذا كانت الصفحة معروضة على HTTP أو HTTPS وجودة الصفحة وتوفُّر عنوان URL في خريطة الموقع، بالإضافة إلى أي تصنيف rel=canonical
. ويمكنك إبلاغ محرك البحث Google بالصفحة التي تفضّلها باستخدام هذه الطرق، ولكنه قد يختار صفحة أساسية أخرى لأسباب مختلفة.
لا تُعدّ النُسخ بلغات مختلفة لصفحة واحدة نُسخًا مكرّرة إلّا إذا كان المحتوى الرئيسي باللغة نفسها (أي إذا لم تتمّ ترجمة سوى الرأس والتذييل وغيرهما من النصوص غير المهمة وبقي النص الأساسي كما هو، عندها تُعدّ الصفحات مكرّرة).
يستخدم محرك البحث Google الصفحات الأساسية كمصادر رئيسية لتقييم المحتوى والجودة. وتشير عادةً نتيجة البحث من Google إلى الصفحة الأساسية، إلّا إذا كان من الواضح أنّ إحدى النُسخ المكرّرة تناسب المستخدم على نحو أفضل. على سبيل المثال، من المرجّح أن تشير نتيجة البحث إلى صفحة متوافقة مع الأجهزة الجوّالة إذا كان الجهاز المستخدَم هو جهازًا جوّالاً حتى إذا تم تصنيف الصفحة المتوافقة مع أجهزة الكمبيوتر على أنها الصفحة الأساسية.
أسباب ظهور صفحات مماثلة أو مكرّرة
هناك أسباب وجيهة تبرّر احتواء موقعك الإلكتروني على عناوين URL مختلفة تشير إلى الصفحة نفسها أو على صفحات مكرّرة أو متشابهة جدًا ضمن عناوين URL مختلفة. وفي ما يلي الأسباب الأكثر شيوعًا:
- التوافق مع عدة أنواع من الأجهزة:
https://example.com/news/koala-rampage https://m.example.com/news/koala-rampage https://amp.example.com/news/koala-rampage
- تفعيل عناوين URL ديناميكية لعناصر مثل معلَمات الترتيب أو الفلترة أو أرقام تعريف الجلسات:
https://www.example.com/products?category=dresses&color=green https://example.com/dresses/cocktail?gclid=ABCD https://www.example.com/dresses/green/greendress.html
- إذا كان نظام مدوّنتك يحفظ عدة عناوين URL تلقائيًا عند إضافة المشاركة نفسها ضمن أقسام متعددة:
https://blog.example.com/dresses/green-dresses-are-awesome/ https://blog.example.com/green-things/green-dresses-are-awesome/
-
إذا تم إعداد الخادم لعرض المحتوى نفسه للصيغ المزوّدة بالبادئة www أو غير المزوّدة بها، وللصيغ التي تتضمّن منفذ بروتوكول http أو https
:
https://example.com/green-dresses https://example.com/green-dresses https://www.example.com/green-dresses https://example.com:80/green-dresses https://example.com:443/green-dresses
- إذا كنت توفّر محتوى على مدوّنة لمشاركته على مواقع إلكترونية أخرى وتم نسخه كلّه أو جزء منه على هذه النطاقات:
https://news.example.com/green-dresses-for-every-day-155672.html
(المشاركة المقتبسة)https://blog.example.com/dresses/green-dresses-are-awesome/3245/
(المشاركة الأصلية)
لماذا يجب اختيار عنوان URL أساسي؟
هناك عدة أسباب قد تدفعك إلى اختيار صفحة أساسية بشكل صريح ضمن مجموعة من الصفحات المكرّرة أو المتشابهة:
-
تحديد عنوان URL الذي تريد أن يراه المستخدمون في نتائج البحث: ربما تفضّل أن يصل المستخدمون إلى صفحة الفساتين الخضراء من خلال
https://www.example.com/dresses/green/greendress.html
بدلاً منhttps://example.com/dresses/cocktail?gclid=ABCD
. -
دمج إشارات الروابط للصفحات المشابهة أو المكرّرة: يساعد هذا الإجراء محرّكات البحث في دمج المعلومات المتوفرة لديها بخصوص عناوين URL الفردية (مثل الروابط المؤدية إليها) في عنوان URL واحد مفضّل. بعبارة أخرى، يتم دمج الروابط التي تؤدي إلى
https://example.com/dresses/cocktail?gclid=ABCD
من مواقع إلكترونية أخرى مع الروابط التي تؤدي إلىhttps://www.example.com/dresses/green/greendress.html
. - تبسيط مقاييس التتبّع لمنتج واحد أو موضوع واحد: مع توفّر مجموعة متنوعة من عناوين URL، قد يصعب الحصول على مقاييس موحّدة لنوع محدد من المحتوى.
- إدارة المحتوى المقتبَس: إذا كنت تشارك المحتوى الخاص بك لنشره على نطاقات أخرى، ننصحك بالتأكد من ظهور عنوان URL المفضّل لديك في نتائج البحث.
- تجنُّب قضاء وقت في الزحف إلى الصفحات المكرّرة: السيناريو الأمثل هو أن يستفيد Googlebot إلى أقصى حدّ من موقعك الإلكتروني، لذا من الأفضل له أن يقضي الوقت في الزحف إلى صفحات جديدة (أو معدّلة) على موقعك الإلكتروني بدلاً من الزحف إلى الإصدارات المخصّصة لأجهزة الكمبيوتر والإصدارات المخصّصة للأجهزة الجوّالة من الصفحات نفسها.
معرفة الصفحة التي يعتبرها محرّك البحث Google أساسية
يمكنك استخدام أداة فحص عنوان URL لمعرفة الصفحة التي يعتبرها محرك بحث Google أساسية. حتى إذا حددت صفحة أساسية بشكل واضح، قد يختار محرك بحث Google صفحة أساسية مختلفة لأسباب متعددة، مثل الأداء أو المحتوى.
تحديد صفحة أساسية
لتحديد عنوان URL أساسي لعناوين URL مكرّرة أو صفحات متشابهة، اختَر إحدى الطرق التالية. ننصحك باستخدام أي من هذه الطرق، ولكن يُرجى العِلم بأنها كلّها ليست إلزامية. وإذا لم تحدّد عنوان URL أساسيًا، سنحدّد ما نعتقد أنه أفضل نسخة أو عنوان URL. وتأكَّد من اتّباع الإرشادات العامة.
الأسلوب والوصف | |||
---|---|---|---|
العلامة rel=canonical <link> |
أضف علامة
|
||
عنوان HTTP rel=canonical |
أرسِل عنوان
|
||
خريطة الموقع |
حدّد صفحاتك الأساسية في ملف Sitemap.
|
||
إعادة توجيه 301 |
يمكنك استخدام عمليات إعادة التوجيه 301 للإشارة إلى Googlebot بأنّه يتوفّر عنوان URL مُعاد توجيهه يمثّل إصدارًا أفضل من عنوان URL آخر معيّن.
ننصحك بعدم استخدام هذه العمليات إلّا عند إيقاف صفحة مكرّرة معيّنة نهائيًا. |
||
صيغة AMP | إذا كانت إحدى الصيغ عبارة عن صفحة AMP، اتّبِع إرشادات AMP للإشارة إلى الصفحة الأساسية وصيغة AMP. |
الإرشادات العامة
عند اتّباع أي طريقة من طرق تحديد عنوان URL الأساسي، اتّبِع هذه الإرشادات العامة:
- لا تستخدم ملف robots.txt لأغراض متعلقة بتحديد عناوين URL الأساسية.
- لا تستخدم أداة إزالة عناوين URL لأغراض متعلقة بتحديد عناوين URL الأساسية، لأنّها تزيل كل إصدارات عنوان URL من "بحث Google".
- لا تحدّد عناوين URL مختلفة على أنّها عناوين أساسية للصفحة نفسها، سواء باستخدام أساليب متطابقة لتحديد عنوان URL الأساسي أم أساليب مختلفة (على سبيل المثال، لا تحدّد عنوان URL معيّنًا في خريطة الموقع وعنوان URL مختلفًا للصفحة نفسها باستخدام
rel="canonical"
). - لا تستخدِم علامة
noindex
كوسيلة لمنع اختيار صفحة أساسية. وتهدف هذه القاعدة إلى استبعاد الصفحة من الفهرس، وليس إلى إدارة كيفية اختيار الصفحة الأساسية. -
حدِّد صفحة أساسية عند استخدام علامات hreflang. وحدِّد صفحة أساسية باللغة ذاتها أو بأفضل لغة بديلة ممكنة إذا لم تتوفر صفحة أساسية للغة ذاتها.
-
أنشِئ روابط تؤدي إلى عنوان URL الأساسي وليس إلى عنوان URL المكرّر أثناء الربط بموقعك الإلكتروني. ومن خلال إنشاء روابط بشكل متّسق تؤدي إلى عنوان URL الذي تعتبره أساسيًا، يمكنك مساعدة محرك البحث Google على فهم خيارك المفضّل.
تفضيل HTTPS على HTTP لعناوين URL الأساسية
يفضّل محرك البحث Google صفحات HTTPS على صفحات HTTP المكافئة عند اختيار صفحات أساسية، باستثناء عندما تكون ثمة مشاكل أو إشارات متضاربة مثل ما يلي:
- تتضمن صفحة HTTPS شهادة طبقة مقابس آمنة (SSL) غير صالحة.
- تحتوي صفحة HTTPS على تبعيات غير آمنة (بخلاف الصور).
- تعيد صفحة HTTPS توجيه المستخدمين إلى صفحة HTTP أو من خلالها.
- تتضمّن صفحة HTTPS علامة
link
rel="canonical"
يؤدي إلى صفحة HTTP.
علمًا أنّ أنظمتنا تفضّل صفحات HTTPS على صفحات HTTP بشكل تلقائي، يمكنك ضمان التزام الأنظمة بذلك عن طريق اتّباع أيٍّ من الإجراءات التالية:
- إضافة عمليات إعادة توجيه من صفحة HTTP إلى صفحة HTTPS
- إضافة علامة
link
rel="canonical"
تؤدّي من صفحة HTTP إلى صفحة HTTPS - تنفيذ سياسة HSTS
لمنع محرك البحث Google من اختيار صفحة HTTP كصفحة أساسية بشكلٍ خاطئ، تجنَّب الممارسات التالية:
- تجنَّب شهادات بروتوكول أمان طبقة النقل (TLS) أو طبقة المقابس الآمنة غير الصالحة وعمليات إعادة التوجيه من HTTPS إلى HTTP، لأنها تجعل محرّك بحث Google يفضّل HTTP إلى حد كبير جدًا. ولا يمكن أن يلغي تنفيذ HSTS هذا التفضيل القوي.
- تجنَّب تضمين صفحة HTTP في ملف Sitemap أو إدخالات hreflang بدلاً من إصدار HTTPS.
- تجنَّب تطبيق شهادة طبقة المقابس الآمنة أو بروتوكول أمان طبقة النقل على صيغة المضيف غير الصحيحة، على سبيل المثال، عن طريق عرض شهادة www.example.com على example.com. يجب أن تتطابق الشهادة مع عنوان URL الكامل للموقع الإلكتروني أو أن تكون شهادة أحرف بدل يمكن استخدامها لنطاقات فرعية متعددة في أحد النطاقات.
استخدام علامة rel="canonical"
link
تُستخدم علامة الرابط rel=”canonical” (علامة أساسية) في قسم العنوان في ملف HTML للإشارة إلى أنّ الصفحة تتداخل مع صفحة أخرى. للإشارة إلى أنّ الصفحة نسخة مكرّرة عن صفحة أخرى، يمكنك استخدام علامة <link>
في قسم head
من ترميز HTML.
لنفترض أنّك تريد تحديد https://example.com/dresses/green-dresses
كعنوان URL أساسي، علمًا أنّ مجموعة متنوعة من عناوين URL يمكنها الوصول إلى هذا المحتوى، يمكنك الإشارة إلى عنوان URL هذا
كعنوان أساسي باتّباع الخطوات التالية:
-
أضِف علامة رابط
rel="canonical"
إلى كل الصفحات المكرّرة.أضِف عنصر
<
مع السمةlink
>rel="canonical"
إلى قسم<head>
في الصفحات المكرّرة للإشارة إلى الصفحة الأساسية. مثلاً:<link rel="canonical" href="https://example.com/dresses/green-dresses" />
-
إذا كانت الصفحة الأساسية تحتوي على صيغة مخصّصة للأجهزة الجوّالة، أضِف علامة
link
rel="alternate"
إليها للإشارة إلى إصدار الصفحة المخصّص للأجهزة الجوّالة:<link rel="alternate" media="only screen and (max-width: 640px)" href="https://m.example.com/dresses/green-dresses">
- أضِف أي علامة hreflang أو عمليات إعادة توجيه أخرى مناسبة للصفحة.
استخدِم المسارات المطلقة بدلاً من المسارات النسبية مع العلامة rel="canonical"
link
.
مثال جيد:
https://www.example.com/dresses/green/greendress.html
مثال غير صالح:
/dresses/green/greendress.html
إذا كنت تستخدم لغة JavaScript لإضافة علامة رابط rel="canonical"
، تأكَّد من إدخال علامة الرابط الأساسية على النحو الصحيح.
استخدام عنوان HTTP يتضمن السمة rel="canonical"
إذا كان بإمكانك إعداد خادمك، يمكنك استخدام عنوان HTTP يتضمن السمة rel="canonical"
(بدلاً من علامة HTML) للإشارة إلى عنوان URL الأساسي لمستند متوافق مع "بحث Google"،
بما في ذلك المستندات التي ليست بتنسيق HTML، مثل ملفات PDF.
يتوافق محرك البحث Google في الوقت الحالي مع هذه الطريقة لنتائج بحث الويب فقط.
إذا كنت تعرض ملفًا بتنسيق PDF من خلال عدة عناوين URL، يمكنك إضافة عنوان HTTP يتضمن السمة rel="canonical"
لإعلام Googlebot بعنوان URL الأساسي الخاص بملف PDF:
Link: <https://www.example.com/downloads/white-paper.pdf>; rel="canonical"
إن اقتراحات عنوان HTTP rel="canonical"
هي نفسها
كتلك الخاصة بعلامة rel="canonical"
link
. ووفقًا
لمعيار RFC2616، يمكنك استخدام
علامات الاقتباس المزدوجة فقط في عنوان HTTP rel="canonical"
.
استخدام ملف Sitemap
اختَر عنوان URL أساسيًا لكل صفحة من صفحاتك وأرسله في خريطة الموقع. يتم اقتراح جميع الصفحات المدرَجة في خريطة الموقع على أنّها صفحات أساسية، ويحدّد محرّك بحث Google الصفحات المكرّرة (إذا وُجدَت) استنادًا إلى تشابه المحتوى.
نحن لا نضمن أنّنا سنعتبر عناوين URL المدرَجة في خريطة الموقع على أنّها أساسية، ولكنّ خرائط الموقع هي طريقة بسيطة لتعريف العناوين الأساسية في موقع إلكتروني كبير، وهي مفيدة لإبلاغ محرّك بحث Google بالصفحات التي تعتبرها الأكثر أهمية على موقعك الإلكتروني.
لا تُضمِّن صفحات غير أساسية في خريطة موقع. وإذا كنت تستخدم خريطة موقع، حدِّد فيها عناوين URL الأساسية فقط.
استخدام عمليات إعادة التوجيه 301
لعناوين URL التي تمت إزالتها
استخدِم هذه الطريقة للتخلص من الصفحات المكرّرة الحالية مع ضمان عملية انتقال سلسة قبل إزالة عناوين URL القديمة.
لنفترض أنه يمكن الوصول إلى صفحتك من خلال عدة طرق:
https://example.com/home
https://home.example.com
https://www.example.com
اختَر أحد عناوين URL هذه كعنوان URL الأساسي، واستخدِم عمليات إعادة التوجيه 301
لتحويل الزيارات من
عناوين URL الأخرى إلى عنوان URL الذي تفضّله. تُعدّ عملية إعادة التوجيه 301
من جانب الخادم أفضل طريقة لضمان
توجيه المستخدمين ومحركات البحث إلى الصفحة الصحيحة. ويشير رمز الحالة 301
إلى أنّه
تم نقل إحدى الصفحات إلى مكان جديد بشكل دائم.
إذا كنت مشتركًا في خدمة استضافة للمواقع الإلكترونية، ابحث عن المستندات المتعلقة بإعداد
عمليات إعادة التوجيه 301
.
تحديد المشاكل وحلّها
إذا كان عنوان URL الأساسي في موقع إلكتروني لا تملكه، لن تتمكّن من الاطّلاع على أي من الزيارات في الصفحة المكرّرة. في ما يلي بعض الأسباب الشائعة التي قد تؤدي إلى توفّر عنوان URL أساسي في موقع إلكتروني منفصل:
- صيغ اللغة المحددة على نحو غير صحيح: إذا كانت لديك عدة مواقع إلكترونية تعرض محتوًى مشابهًا تمت ترجمته ليصل إلى المستخدمين في كل أنحاء العالم، تأكَّد من اتّباع إرشاداتنا بشأن المواقع الإلكترونية المترجمة.
- العلامات الأساسية غير الصحيحة: قد تستخدم بعض أنظمة إدارة المحتوى (CMS) أو المكوّنات الإضافية لأنظمة إدارة المحتوى أساليب تحديد العنوان الأساسي بشكل غير صحيح للتوجيه إلى عناوين URL على مواقع إلكترونية خارجية. لذلك، عليك التحقق من المحتوى الخاص بك لمعرفة ما إذا كان ذلك منطبقًا عليك. إذا كان موقعك الإلكتروني يشير إلى
خيار مفضّل غير متوقّع لعنوان URL أساسي نتيجة استخدام غير صحيح
لعلامة
rel="canonical"
أو عملية إعادة توجيه301
مثلاً، ننصحك بإصلاح هذه المشكلة مباشرةً. - الخوادم التي تم إعدادها بشكل غير صحيح: قد تؤدي عملية الإعداد غير الصحيحة للخادم الذي يستضيف موقعك الإلكتروني إلى اختيار غير متوقّع لعنوان URL في عدة نطاقات. مثلاً:
- قد يتم إعداد الخادم بشكل غير صحيح، فيعرض محتوى من a.com كاستجابة لطلب عرض عنوان URL على b.com.
- قد يعرض خادمان مختلفان على الويب
صفحات
soft 404
متطابقة يتعذّر على محرك بحث Google تحديدها على أنها تحتوي على أخطاء.
- اختراق الصفحات باستخدام البرامج الضارة: تُدخل بعض الهجمات على المواقع الإلكترونية رموزًا تؤدي إلى
عرض إعادة توجيه 301 من خلال HTTP أو تُدرج
علامة رابط
rel="canonical"
على النطاقات المختلفة في<head>
لملف HTML أو في عنوان HTTP، حيث يوجّه عنصر الرابط هذا عادةً إلى عنوان URL يستضيف برامج ضارة أو محتوًى غير مرغوب فيه. وفي هذه الحالات، قد تختار خوارزمياتنا عنوان URL الضار أو غير المرغوب فيه بدلاً من عنوان URL المتوفّر في الموقع الإلكتروني الذي تم اختراقه. - موقع إلكتروني مقلَّد: في بعض الحالات النادرة، قد تختار خوارزمياتنا عنوان URL من موقع إلكتروني خارجي يستضيف المحتوى الخاص بك بدون إذنك. إذا كنت تعتقد أنّ ثمة موقع إلكتروني آخر يعرض نسخة من المحتوى الخاص بك بما يخالف قانون حقوق الطبع والنشر، يمكنك التواصل مع مضيف الموقع الإلكتروني لطلب إزالة هذا المحتوى. بالإضافة إلى ذلك، يمكنك أن تطلب من Google إزالة الصفحة التي تمثل انتهاكًا لحقوق الطبع والنشر من نتائج البحث من خلال تقديم طلب بموجب قانون الألفية الجديدة لحقوق طبع ونشر المواد الرقمية.