פיצוי על הרחבות, פרשנויות ואופטימיזציות ברירת מחדל

ב-Google Cloud Search יש כמה הרחבות, פרשנויות ואופטימיזציות המוגדרות כברירת מחדל שמשפיעים על תוצאות החיפוש. אם נתקלתם בתוצאות לא צפויות משאילתות חיפוש, מומלץ לעיין במדריך הזה לפני שפונים לתמיכה של Cloud Search.

הרחבות ברירת מחדל

נניח שמשתמש מבצע חיפוש באמצעות מחרוזת, כמו [קובצי PDF של אבי], אבל חלק מהתוצאות שהוחזרו מכילות מילים מודגשות כמו 'מסמכים' במקום 'קובצי PDF'. למה התוצאות מכילות את המילים המודגשות שלא נכללו בשאילתת החיפוש?

כברירת מחדל, Google Cloud Search, בדיוק כמו חיפוש האינטרנט של Google, לא מחפש רק את המילים המדויקות בשאילתה. במקום זאת, Cloud Search מרחיב את השאילתה כך שיכלול מילים נרדפות ונגיש מילים (גם אם לא הטמעתם מילים נרדפות משלכם). ההרחבה הזו מתבצעת כדי לאחזר מסמכים שתואמים באופן נרחב לרעיון ולכוונה של השאילתה. לאחר הבחירה בקבוצה הרחבה הזו של מסמכים, האלגוריתמים של הדירוג פועלים כדי להבטיח שההתאמות הטובות ביותר יוצבו בראש קבוצת התוצאות.

כשהמשתמש חיפש את [Joes PDFs], Cloud Search סיפק את הפרטים הבאים כמילים מקובלות נוספות:

  • עבור [Joe’s], Cloud Search עשוי גם להתאים ל-"joe" (הרחבת השורש) ול-"joes" (מילה נרדפת שמבוססת על סימני פיסוק).
  • עבור [קובצי PDF], יכול להיות ש-Cloud Search יתאים גם ל-'documents' (הרחבת מילים נרדפות) ל-'pdf' (הרחבת שורש).

כברירת מחדל, מילים נרדפות לא בהכרח דו-כיווניות. לדוגמה, אם משתמשים מחפשים את המונח "פישינג", יכול להיות ש-Cloud Search יתאים ל"פישינג" כהרחבה של מילה נרדפת. עם זאת, אם משתמש יחפש את המונח 'פישינג', יכול להיות ש-Google לא תתאים את 'פישינג' כהרחבה.

הרחבות של מילים מוקפות לעומת מילים ללא מקף

כשהמשתמשים מחפשים מילים שמקפים מילים ומילים שמקבילות להן ללא מקף, כמו [חדר ארונות בחדר] ו[מלהק בארון], Cloud Search מתייחס לשאילתות האלה באופן שונה.

בנוסף, אופטימיזציות שונות משמשות למילים עם מקף או עם קו תחתון, כמו [הליכה במקום] ו-[walk_in].

פיצוי על הרחבות המוגדרות כברירת מחדל

אנחנו לא מבטיחים הרחבה כלשהי כברירת מחדל. אם אתם רוצים להבטיח דו-כיווניות של מילים נרדפות או הרחבות של מילים נרדפות ספציפיות לדומיין, עליכם ליצור קבוצה משלכם של מילים נרדפות שספציפיות לדומיין. למידע נוסף על שימוש במילים נרדפות, קראו את המאמר הגדרת מילים נרדפות.

פירוש ברירת המחדל

Cloud Search מספק גם פירוש של שפה טבעית (NLP) שמתפרש לפי האובייקטים, המאפיינים וערכי השדות בשאילתה, בהתאם לסכימה שהועלתה למקור נתונים ספציפי. למידע נוסף על פירוש השפה הטבעית, קראו את המאמר בניית הסכימה לפרשנות אופטימלית של שאילתות.

השבתת פרשנויות בשפה טבעית

כדי להשבית פירושים בשפה טבעית של שאילתה ספציפית, צריך להגדיר את הערך QueryInterpretationOptions.disableNlInterpretation כ-true בבקשת החיפוש.

אופטימיזציות ברירת מחדל

ב-Cloud Search יש גם את האופטימיזציות הבאות המוגדרות כברירת מחדל:

  • שילוב תוצאות שסופקו על ידי תיקון איות. לדוגמה, אם מחרוזת השאילתה הייתה [corpoate savings],, Cloud Search יתאים ל-"corpoate" ולאיות הנכון של "corporate".

  • בתגובה לשאילתות שלא הניבו תוצאות בכלל או מעט תוצאות, ב-Cloud Search נעשה שימוש בקבוצה מגבילה יותר של מונחים קשורים, שרחבה יותר ממילים נרדפות ישירות, כדי להתאים בין התוצאות. למידע נוסף קראו את המאמר טיפול בתוצאות משלימות.

נרמול מסמכים ושאילתות

נירמול מתייחס לתקינה של מילים או ביטויים מסוימים לפני או אחרי שאילתה. כדי להבטיח תגובות עקביות לשאילתות, כדאי לנרמל את המסמכים (לפני או במהלך ההוספה לאינדקס) ואת השאילתות (אחרי שהמשתמשים ביצעו את השאילתה) בדרכים הבאות:

  • כדי לנרמל מסמכים:

    1. כדאי לבחור איות קנוני למילים קריטיות במסמכים במאגרים שלכם.
    2. צריך לתקן את האיות במסמכי מאגר המקור או כשמוסיפים תוכן לאינדקס, כך שיתאים לאיות הקנונית.
  • כדי לנרמל שאילתות:

    1. אפשר ליירט שאילתות של משתמשים לפני ששולחים אותן אל Cloud Search.
    2. כותבים מחדש מילים בשאילתות משתמש כך שיתאימו לאיות הנפוץ ביותר במקור הנתונים שנוספו לאינדקס.
    3. שולחים את השאילתה אל Cloud Search.

השבתת הרחבות, פרשנויות ואופטימיזציות של כל השאילתות

כדי להשבית הרחבות, פירושים ואופטימיזציות של שאילתה ספציפית, מגדירים את הערך QueryInterpretationOptions.enableVerbatim Mode כ-true בבקשת החיפוש.