بهبود کیفیت جستجو

کیفیت جستجو به کیفیت نتایج جستجو از نظر رتبه‌بندی و میزان یادآوری آن، آنطور که توسط کاربر درک می‌شود، اشاره دارد.

رتبه‌بندی به ترتیب آیتم‌ها و فراخوانی به تعداد آیتم‌های مرتبط بازیابی شده گفته می‌شود. یک آیتم (یا سند) هر قطعه از محتوای دیجیتالی است که Google Cloud Search می‌تواند آن را فهرست‌بندی کند، مانند اسناد مایکروسافت آفیس، فایل‌های PDF، ردیف‌های پایگاه داده یا URLهای منحصر به فرد. یک آیتم شامل موارد زیر است:

  • فراداده‌های ساختاریافته
  • محتوای قابل فهرست بندی
  • ACL ها

جستجوی ابری از سیگنال‌های مختلفی برای بازیابی و رتبه‌بندی نتایج استفاده می‌کند. شما می‌توانید از طریق تنظیمات در طرحواره، محتوای آیتم و فراداده و برنامه جستجو، بر این سیگنال‌ها تأثیر بگذارید. این سند به شما کمک می‌کند تا با تغییر این عوامل تأثیرگذار بر سیگنال، کیفیت جستجو را بهبود بخشید.

برای خلاصه‌ای از تنظیمات، به خلاصه تنظیمات کیفیت جستجو مراجعه کنید.

امتیاز اهمیت تأثیرگذاری

موضوعیت، میزان ارتباط یک نتیجه جستجو با عبارات جستجو شده است. Cloud Search، موضوعیت را بر اساس موارد زیر محاسبه می‌کند:

  • اهمیت هر عبارت جستجو.
  • تعداد بازدیدها (تعداد دفعاتی که یک عبارت جستجو در محتوا یا فراداده ظاهر می‌شود).
  • انواع تطابق بین عبارات جستجو و موارد فهرست‌بندی شده.

برای تأثیرگذاری بر امتیاز موضوعیت یک ویژگی متنی، RetrievalImportance را در طرحواره خود تعریف کنید. تطابق روی یک ویژگی با RetrievalImportance بالا منجر به امتیاز بالاتر می‌شود.

برای مثال، اگر تاریخچه‌ی باگ‌های نرم‌افزاری را ذخیره می‌کنید، کاربران احتمالاً بر اساس نام باگ جستجو می‌کنند. مقدار RetrievalImportance را برای نام باگ روی HIGHEST تنظیم کنید. برای توضیحات، DEFAULT استفاده کنید.

{
  "objectDefinitions": [
    {
      "name": "issues",
      "propertyDefinitions": [
        {
          "name": "summary",
          "textPropertyOptions": {
            "retrievalImportance": { "importance": "HIGHEST" }
          }
        },
        {
          "name": "description",
          "textPropertyOptions": {
            "retrievalImportance": { "importance": "DEFAULT" }
          }
        }
      ]
    }
  ]
}

برای اسناد HTML، برچسب‌هایی مانند <title> و <h1> به تعیین اهمیت اصطلاح کمک می‌کنند. اگر ContentFormat برابر TEXT باشد، ItemContent از اهمیت DEFAULT استفاده می‌کند. اگر HTML باشد، اهمیت به ویژگی‌های HTML بستگی دارد.

بر تازگی تأثیر بگذارید

تازگی ، با استفاده از createTime و updateTime در ItemMetadata ، میزان تغییرات اخیر یک آیتم را اندازه‌گیری می‌کند. آیتم‌های قدیمی‌تر رتبه پایین‌تری دارند.

شما می‌توانید با تنظیم freshnessProperty و freshnessDuration در FreshnessOptions ، بر تازگی تأثیر بگذارید. freshnessProperty به شما امکان می‌دهد به جای updateTime از یک تاریخ یا مهر زمانی سفارشی استفاده کنید. برای اشکالات، می‌توانید از یک تاریخ سررسید استفاده کنید تا مواردی که تاریخ نزدیک‌تری به زمان حال دارند، رتبه بالاتری کسب کنند.

{
  "objectDefinitions": [
    {
      "name": "issues",
      "options": {
        "freshnessOptions": { "freshnessProperty": "duedate" }
      }
    }
  ]
}

freshnessDuration برای مشخص کردن زمان قدیمی بودن یک آیتم استفاده کنید. مقدار بالا، مانند ۱۰۰ سال، اثر تازگی را خنثی می‌کند. این برای داده‌های استاتیک مانند پروفایل کارمندان مفید است. برای اخبار، از مقدار کمی مانند سه روز استفاده کنید.

کیفیت تأثیرگذاری

کیفیت، دقت و سودمندی یک آیتم را اندازه‌گیری می‌کند. با استفاده از SearchQualityMetadata مقداری بین ۰ و ۱ تعیین کنید. مقادیر بالاتر رتبه‌بندی را افزایش می‌دهند. به عنوان مثال، ممکن است اسناد مزایایی که توسط منابع انسانی نوشته شده‌اند را افزایش دهید.

{
  "metadata": {
    "searchQualityMetadata": { "quality": 1.0 }
  }
}

تأثیرگذاری با استفاده از نوع فیلد

شما می‌توانید با استفاده از OrderedRanking بر اساس ویژگی‌های enum یا integer بر رتبه‌بندی تأثیر بگذارید:

  • NO_ORDER (پیش‌فرض): هیچ تاثیری بر رتبه‌بندی ندارد.
  • ASCENDING : مقادیر بالاتر رتبه‌بندی را افزایش می‌دهند.
  • DESCENDING : مقادیر پایین‌تر رتبه‌بندی را افزایش می‌دهند.

برای اولویت‌بندی اشکال، اگر HIGH برابر با ۱ و LOW برابر با ۳ باشد، از DESCENDING استفاده کنید. برای ویژگی votes ، ASCENDING استفاده کنید.

از طریق گسترش جستجو، رتبه‌بندی را تحت تأثیر قرار دهید

گسترش پرس‌وجو از مترادف‌ها و املا برای بهبود نتایج استفاده می‌کند.

از مترادف‌ها استفاده کنید

جستجوی ابری از محتوای وب عمومی برای مترادف‌ها استفاده می‌کند. همچنین می‌توانید مترادف‌های سفارشی برای اصطلاحات خاص سازمان تعریف کنید. به بخش تعریف مترادف‌ها مراجعه کنید.

از املا استفاده کنید

جستجوی ابری در SpellResult پیشنهادهای املایی ارائه می‌دهد. همچنین از اصلاحات املایی به عنوان مترادف برای یافتن اسناد استفاده می‌کند.

از طریق تنظیمات برنامه جستجو، رتبه‌بندی را تحت تأثیر قرار دهید

یک برنامه جستجو اطلاعات زمینه‌ای ارائه می‌دهد. شما می‌توانید با استفاده از تنظیمات زیر بر رتبه‌بندی تأثیر بگذارید.

پیکربندی امتیازدهی را تنظیم کنید

برای غیرفعال کردن تازگی یا شخصی‌سازی، یک ScoringConfig مشخص کنید. غیرفعال کردن شخصی‌سازی، مالکیت و افزایش تعامل را حذف می‌کند. به Customize the search experience مراجعه کنید.

پیکربندی منبع را تنظیم کنید

تنظیمات سطح منبع داده را مشخص کنید:

  • اهمیت منبع : مواردی که از منبعی با اهمیت HIGH هستند، رتبه بالاتری دارند.
  • ازدحام : نتایج حاصل از یک منبع واحد را محدود می‌کند (پیش‌فرض ۳ است) تا تنوع تضمین شود.

شخصی سازی

شخصی‌سازی، نتایج را بر اساس کاربر اولویت‌بندی می‌کند:

  • مالکیت کالا : اقلام تحت مالکیت کاربر را افزایش می‌دهد.
  • تعامل با آیتم‌ها : آیتم‌هایی را که کاربر اخیراً مشاهده، ویرایش یا در مورد آنها نظر داده است، افزایش می‌دهد.
  • کلیک‌های کاربر : مواردی را که کاربر قبلاً روی آنها کلیک کرده است، افزایش می‌دهد. URL نتیجه را تغییر ندهید، زیرا برای جمع‌آوری این داده‌ها استفاده می‌شود.

تفسیر پرس و جو

ویژگی تفسیر پرس‌وجو، پرس‌وجوهای کاربر را با استفاده از تعاریف طرحواره به پرس‌وجوهای ساختاریافته و مبتنی بر اپراتور تبدیل می‌کند. این امر حتی با حداقل کلمات کلیدی، نتایج دقیقی را ارائه می‌دهد. برای تفسیر بهینه پرس‌وجو، به ساختار یک طرحواره مراجعه کنید.

زبان مورد

جستجوی ابری مواردی را که زبان آنها با زبان پرس‌وجو مطابقت ندارد، تنزل رتبه می‌دهد. languageCode در RequestOptions روی ترجیح کاربر تنظیم کنید.

زمینه مورد

contextAttributes برای افزایش رتبه‌بندی موارد مرتبط با زمینه جستجو، مانند مکان یا دپارتمان، استفاده کنید.

محبوبیت کالا

جستجوی ابری مواردی را که کاربران مرتباً در جستجوهای اخیر کلیک می‌کنند، افزایش می‌دهد. URL های نتایج جستجو را تغییر ندهید، زیرا از آنها برای ردیابی این کلیک‌ها استفاده می‌شود.

خلاصه‌ای از تنظیمات کیفیت جستجو

جداول زیر خلاصه‌ای از تنظیمات کیفیت جستجو را ارائه می‌دهند:

تنظیمات طرحواره

تنظیم مکان توصیه جزئیات
ItemContent ItemContent توصیه شده موضوعیت
RetrievalImportance RetrievalImportance توصیه شده موضوعیت
FreshnessOptions FreshnessOptions اختیاری تازگی

تنظیمات نمایه‌سازی

تنظیم مکان توصیه جزئیات
createTime / updateTime ItemMetadata توصیه شده تازگی
contentLanguage ItemMetadata توصیه شده زبان مورد
owners ItemAcl توصیه شده مالکیت کالا
مترادف‌های سفارشی _dictionaryEntry توصیه شده از مترادف‌ها استفاده کنید
quality SearchQualityMetadata اختیاری کیفیت تأثیرگذاری
داده‌های تعامل interaction اختیاری تعامل آیتم
OrderedRanking OrderedRanking اختیاری نوع فیلد

تنظیمات برنامه را جستجو کنید

تنظیم مکان توصیه جزئیات
غیرفعال کردن شخصی‌سازی ScoringConfig توصیه شده شخصی سازی
اهمیت منبع SourceCrowdingConfig اختیاری پیکربندی منبع
ازدحام جمعیت SourceCrowdingConfig اختیاری پیکربندی منبع

مراحل بعدی

  1. یک طرحواره برای تفسیر بهینه پرس و جو ایجاد کنید .
  2. مترادف‌ها را تعریف کنید .