تحسين جودة البحث

تشير جودة البحث إلى جودة نتائج البحث من حيث الترتيب والاسترجاع كما يراها المستخدم.

الترتيب هو ترتيب العناصر، والاسترجاع هو عدد العناصر ذات الصلة التي تم استرجاعها. العنصر (أو المستند) هو أي جزء من المحتوى الرقمي يمكن أن يفهرسه Google Cloud Search، مثل مستندات Microsoft Office أو ملفات PDF أو صفوف قاعدة البيانات أو عناوين URL الفريدة. يتألف العنصر مما يلي:

  • البيانات الوصفية البنيوية
  • المحتوى القابل للفهرسة
  • قوائم ACL

تستخدم Cloud Search إشارات مختلفة لاسترداد النتائج وترتيبها. يمكنك التأثير في هذه الإشارات من خلال الإعدادات في المخطط ومحتوى العنصر والبيانات الوصفية وتطبيق البحث. يساعدك هذا المستند في تحسين جودة البحث من خلال تعديل هذه العوامل المؤثرة في الإشارات.

للاطّلاع على ملخّص للإعدادات، يُرجى الانتقال إلى ملخّص إعدادات جودة البحث.

التأثير في نتيجة مدى صلة المحتوى بالموضوع

الملاءمة هي مدى صلة نتيجة البحث بعبارات البحث. تحسب خدمة Cloud Search مدى الصلة بالموضوع استنادًا إلى ما يلي:

  • أهمية كل كلمة من كلمات البحث
  • عدد النتائج (عدد مرّات ظهور عبارة البحث في المحتوى أو البيانات الوصفية)
  • أنواع المطابقة بين عبارات البحث والعناصر المفهرسة

للتأثير في نتيجة الملاءمة الموضوعية لسمة نصية، حدِّد RetrievalImportance في المخطط. تؤدي المطابقة مع موقع إلكتروني يحقّق نتائج RetrievalImportance عالية إلى الحصول على تقييم أعلى.

على سبيل المثال، إذا كنت تخزّن سجلّ أخطاء البرامج، من المرجّح أنّ يبحث المستخدمون حسب اسم الخطأ. اضبط RetrievalImportance للاسم على HIGHEST. بالنسبة إلى الأوصاف، استخدِم DEFAULT.

{
  "objectDefinitions": [
    {
      "name": "issues",
      "propertyDefinitions": [
        {
          "name": "summary",
          "textPropertyOptions": {
            "retrievalImportance": { "importance": "HIGHEST" }
          }
        },
        {
          "name": "description",
          "textPropertyOptions": {
            "retrievalImportance": { "importance": "DEFAULT" }
          }
        }
      ]
    }
  ]
}

بالنسبة إلى مستندات HTML، تساعد علامات مثل <title> و<h1> في تحديد أهمية المصطلح. إذا كانت قيمة ContentFormat هي TEXT، تستخدم ItemContent مستوى الأهمية DEFAULT. إذا كانت القيمة HTML، تعتمد الأهمية على خصائص HTML.

حداثة التأثير

تقيس الحداثة مدى قرب تاريخ تعديل عنصر ما، وذلك باستخدام createTime وupdateTime في ItemMetadata. تحصل العناصر الأقدم على ترتيب أقل.

يمكنك التأثير في مدى الحداثة من خلال تعديل freshnessProperty وfreshnessDuration في FreshnessOptions. تتيح لك السمة freshnessProperty استخدام تاريخ أو طابع زمني مخصّص بدلاً من updateTime. بالنسبة إلى الأخطاء، يمكنك استخدام تاريخ استحقاق لترتيب العناصر التي تتضمّن تواريخ أقرب إلى الوقت الحالي في مرتبة أعلى.

{
  "objectDefinitions": [
    {
      "name": "issues",
      "options": {
        "freshnessOptions": { "freshnessProperty": "duedate" }
      }
    }
  ]
}

استخدِم freshnessDuration لتحديد الوقت الذي تُعتبر فيه السلعة قديمة. ويؤدي استخدام قيمة عالية، مثل 100 عام، إلى إلغاء تأثير الحداثة. ويكون ذلك مفيدًا للبيانات الثابتة، مثل الملفات الشخصية للموظفين. بالنسبة إلى الأخبار، استخدِم قيمة صغيرة مثل ثلاثة أيام.

تأثير الجودة

تقيس الجودة دقة المحتوى وفائدته. حدِّد قيمة بين 0 و1 باستخدام SearchQualityMetadata. تؤدي القيم الأعلى إلى تحسين الترتيب. على سبيل المثال، يمكنك تعزيز مستندات المزايا التي أعدّتها إدارة الموارد البشرية.

{
  "metadata": {
    "searchQualityMetadata": { "quality": 1.0 }
  }
}

التأثير باستخدام نوع الحقل

يمكنك التأثير في الترتيب استنادًا إلى خصائص التعداد أو الأعداد الصحيحة باستخدام OrderedRanking:

  • NO_ORDER (تلقائي): لا يؤثّر في الترتيب.
  • ASCENDING: القيم الأعلى تؤدي إلى تحسين الترتيب.
  • DESCENDING: القيم الأقل تحسّن الترتيب.

بالنسبة إلى أولوية الخطأ، استخدِم DESCENDING إذا كانت قيمة HIGH هي 1 وقيمة LOW هي 3. بالنسبة إلى votes، استخدِم ASCENDING.

التأثير في الترتيب من خلال توسيع طلب البحث

تستخدم ميزة توسيع نطاق طلب البحث المرادفات والتدقيق الإملائي لتحسين النتائج.

استخدم المرادفات

يستخدم Cloud Search محتوى الويب المتاح للجميع للمرادفات. يمكنك أيضًا تحديد مرادفات مخصّصة للمصطلحات الخاصة بمؤسستك. اطّلِع على مقالة تحديد المرادفات.

استخدام التدقيق الإملائي

تقدّم خدمة Cloud Search اقتراحات إملائية في SpellResult. ويستخدم أيضًا تصحيحات الأخطاء الإملائية كمرادفات للعثور على المستندات.

التأثير في الترتيب من خلال إعدادات "تطبيق بحث Google"

يوفّر تطبيق "بحث Google" معلومات سياقية. يمكنك التأثير في الترتيب باستخدام الإعدادات التالية.

ضبط إعدادات تسجيل النقاط

حدِّد قيمة ScoringConfig لإيقاف الحداثة أو التخصيص. يؤدي إيقاف التخصيص إلى إزالة المالك وتعزيز التفاعل. اطّلِع على مقالة تخصيص تجربة البحث.

تعديل إعدادات المصدر

حدِّد الإعدادات على مستوى مصدر البيانات:

  • أهمية المصدر: تحظى العناصر من مصدر HIGH الأهمية بترتيب أعلى.
  • التكدّس: يحدّ من النتائج من مصدر واحد (القيمة التلقائية هي 3) لضمان التنوّع.

التخصيص

يمنح التخصيص الأولوية للنتائج استنادًا إلى المستخدم:

  • ملكية المحتوى: تعزّز هذه السمة المحتوى الذي يملكه المستخدم.
  • التفاعل مع العناصر: يعزّز هذا الخيار العناصر التي اطّلع عليها المستخدم مؤخرًا أو عدّلها أو علّق عليها.
  • نقرات المستخدم: تعزّز هذه الاستراتيجية ترتيب العناصر التي نقر عليها المستخدم سابقًا. لا تعدّل عنوان URL الخاص بالنتيجة، لأنّه يُستخدَم لجمع هذه البيانات.

تفسير طلب البحث

تحوّل ميزة تفسير طلب البحث طلبات بحث المستخدمين إلى طلبات بحث منظَّمة تستند إلى عوامل تشغيل باستخدام تعريفات المخطط. يوفّر ذلك نتائج دقيقة حتى مع الحد الأدنى من الكلمات الرئيسية. يمكنك الاطّلاع على إنشاء مخطط لتحقيق التفسير الأمثل لطلبات البحث.

لغة السلعة

تخفّض خدمة Cloud Search ترتيب العناصر التي لا تتطابق لغتها مع لغة طلب البحث. اضبط languageCode في RequestOptions على الإعدادات المفضّلة للمستخدم.

سياق السلعة

استخدِم contextAttributes لتحسين ترتيب العناصر ذات الصلة بسياق طلب البحث، مثل الموقع الجغرافي أو القسم.

مدى رواج السلعة

تعزّز Cloud Search العناصر التي ينقر عليها المستخدمون بشكل متكرّر في طلبات البحث الأخيرة. لا تعدّل عناوين URL الخاصة بنتائج البحث لأنّها تُستخدَم لتتبُّع هذه النقرات.

ملخّص لإعدادات جودة البحث

تقدّم الجداول التالية ملخّصًا لإعدادات جودة البحث:

إعدادات المخطط

الإعداد الموقع الجغرافي الاقتراح التفاصيل
ItemContent ItemContent خيار ننصح به الملاءمة للموضوع
RetrievalImportance RetrievalImportance خيار ننصح به الملاءمة للموضوع
FreshnessOptions FreshnessOptions اختياري الحداثة

إعدادات الفهرسة

الإعداد الموقع الجغرافي الاقتراح التفاصيل
createTime/updateTime ItemMetadata خيار ننصح به الحداثة
contentLanguage ItemMetadata خيار ننصح به لغة السلعة
owners ItemAcl خيار ننصح به ملكية العنصر
المرادفات المخصّصة _dictionaryEntry خيار ننصح به استخدام المرادفات
quality SearchQualityMetadata اختياري جودة التأثير
بيانات التفاعل interaction اختياري تفاعل مع سلعة
OrderedRanking OrderedRanking اختياري نوع الحقل

إعدادات تطبيق البحث

الإعداد الموقع الجغرافي الاقتراح التفاصيل
تعطيل التخصيص ScoringConfig خيار ننصح به التخصيص
أهمية المصدر SourceCrowdingConfig اختياري إعدادات المصدر
التكديس SourceCrowdingConfig اختياري إعدادات المصدر

الخطوات التالية

  1. تنظيم مخطط لتحقيق التفسير الأمثل لطلبات البحث
  2. تحديد المرادفات