איכות החיפוש מתייחסת לאיכות של תוצאות החיפוש מבחינת הדירוג ולהיזכר כפי שנתפס על ידי המשתמש שהריץ את שאילתת החיפוש.
דירוג מתייחס לסדר הפריטים, וריקול מתייחס למספר הפריטים אוחזרו פריטים רלוונטיים. פריט (נקרא גם מסמך) הוא כל של תוכן דיגיטלי ש-Google Cloud Search יכול להוסיף לאינדקס. סוגי פריטים כוללים מסמכי Microsoft Office, קובצי PDF, שורה במסד נתונים, כתובות URL וכו'. פריט מורכב מ:
- מטא-נתונים מובְנים
- תוכן שניתן להוסיף לאינדקס
- ACLs (רשימות בקרת גישה)
Cloud Search משתמש במגוון אותות כדי לאחזר ולדרג את שאילתות החיפוש תוצאות; של הפריטים שנובעים משאילתת החיפוש. אפשר להשפיע האותות של Cloud Search דרך ההגדרות בסכימה, תוכן הפריט מטא-נתונים (במהלך ההוספה לאינדקס), ואפליקציית החיפוש. מטרת התהליך היא לעזור לכם לשפר את איכות החיפוש על ידי שינוי מובילי דעה.
לסיכום של הגדרות מומלצות ואופציונליות, אפשר לעיין ב סיכום ההגדרות המומלצות והאופציונליות של איכות החיפוש
השפעה על ציון נושאים
הנושא מתייחס לרלוונטיות של תוצאת חיפוש לשאילתה המקורית תנאים. הפופולריות של פריט מסוים מחושבת לפי הקריטריונים הבאים:
- החשיבות של כל מונח שאילתה.
- מספר ההיטים (מספר הפעמים שמונח שאילתה הופיע תוכן או מטא-נתונים).
- סוג ההתאמות למונח השאילתה, והגרסאות שלהן, שיש להן פריט שנוספו לאינדקס ב-Cloud Search.
כדי להשפיע על ציון הנושא של נכס טקסט:
מגדירים את RetrievalImportance
במאפיין הטקסט בסכימה. התאמה לנכס עם רמת התאמה גבוהה
RetrievalImportance
מניב ציון גבוה יותר בהשוואה למשחק
נכס עם רמה נמוכה של RetrievalImportance
.
לדוגמה, נניח שיש לכם מקור נתונים עם המאפיינים הבאים:
- מקור הנתונים משמש לאחסון ההיסטוריה של באגים בתוכנה.
- לכל באג יש שם, תיאור ועדיפות.
רוב המשתמשים שולחים שאילתה לגבי מקור הנתונים הזה באמצעות שם הבאג,
להגדיר את RetrievalImportance
בשם כ-HIGHEST
בסכימה.
לעומת זאת, רוב המשתמשים לא יכולים לשלוח שאילתות על מקור הנתונים הזה באמצעות התיאור של
הבאג, לכן צריך להגדיר את RetrievalImportance
בתיאור כ-DEFAULT
.
בהמשך מוצגת סכימה לדוגמה שמכילה הגדרות של RetrievalImportance
.
{
"objectDefinitions": [
{
"name": "issues",
"propertyDefinitions": [
{
"name": "summary",
"textPropertyOptions": {
"retrievalImportance": {
"importance": HIGHEST
}
}
},
{
"name": "description",
"textPropertyOptions": {
"retrievalImportance": {
"importance": DEFAULT
}
}
},
{
"name": "label",
"isRepeatable": true,
"textPropertyOptions": {
"retrievalImportance": {
"importance": DEFAULT
}
}
},
{
"name": "comments",
"textPropertyOptions": {
"retrievalImportance": {
"importance": DEFAULT
}
}
},
{
"name": "project",
"textPropertyOptions": {
"retrievalImportance": {
"importance": HIGH
}
}
},
{
"name": "duedate",
"datePropertyOptions": {
}
},
...
]
}
]
}
במקרה של מסמכי HTML, תגים כמו <title>
ו-<h1>
, יחד עם
הגדרות פורמט כגון גודל הגופן וגופן מודגש, משמשות כדי לקבוע
החשיבות של מונחים שונים. אם
ContentFormat
היא TEXT
,
ItemContent
יש חשיבות אחזור של DEFAULT
ואם הוא HTML, חשיבות האחזור שלו
נקבעת על סמך מאפייני ה-HTML.
השפעה על עדכניות
עדכניות מדידת המועד שבו פריט השתנה ומועד קביעה
לפי הנכסים createTime
ו-updateTime
ItemMetadata
.
פריטים ישנים יותר יורדים בדרגה בתוצאות החיפוש.
אפשר להשפיע על האופן שבו מחושבת עדכניות של אובייקט על ידי שינוי
freshnessProperty
ו-freshnessDuration
של
FreshnessOptions
בסכימה.
freshnessProperty
מאפשר להשתמש במאפיינים של תאריך או חותמת זמן
עדכניות המחשוב במקום ברירת המחדל updateTime
.
בדוגמה הקודמת שלנו למערכת למעקב אחר באגים בתוכנה, תאריך היעד היה
לשמש כ-freshnessProperty
, כך שפריטים עם תאריך היעד הקרוב ביותר אל
התאריך הנוכחי נחשב "רענן" ומעלה את הדירוג. מעקב אחר הוא
סכימה לדוגמה שמכילה הגדרות של freshnessProperty
:
{
"objectDefinitions": [
{
"name": "issues",
"options": {
"freshnessOptions": {
"freshnessProperty": "duedate"
}
},
"propertyDefinitions": [
{
"name": "summary",
"textPropertyOptions": {
"retrievalImportance": {
"importance": HIGHEST
}
}
},
{
"name": "duedate",
"datePropertyOptions": {
}
},
...
]
}
]
}
אפשר להשתמש ב-freshnessDuration
כדי לזהות מתי פריט נחשב ללא עדכני.
לדוגמה, יכול להיות שיש לכם מקור נתונים שלא נוסף לאינדקס באופן קבוע או
שאינך רוצה שהעדכניות שלו תשפיע על הדירוג. אפשר להשיג
יעד באמצעות ציון ערך גבוה עבור freshnessDuration
.
נניח שיש לכם מקור נתונים עם פרטי פרופיל של עובד. כאן
תרחיש גבוה, אולי כדאי להגדיל את המדד 'freshnessDuration
' כי שינויים בעובד
לרוב, הוא לא רלוונטי לדירוג של העובד. מעקב אחר הוא
סכימה לדוגמה שמכילה הגדרה של freshnessDuration
:
{
"objectDefinitions": [
{
"name": "people",
"options": {
"freshnessOptions": {
"freshnessDuration": "315360000s", # 100 years
}
},
}
]
}
אפשר גם להגדיר ל-freshnessDuration
ערך קטן מאוד עבור מקורות נתונים
שהתוכן שלהם משתנה במהירות, למשל מקור נתונים שמכיל כתבות.
בתרחיש הזה, המסמכים שנוצרו או נערכו לאחרונה הם הרלוונטיים ביותר.
בהמשך מוצגת סכימה לדוגמה שכוללת הגדרה של freshnessDuration
לנתונים
מקור שמכיל תוכן שמשתנה במהירות:
{
"objectDefinitions": [
{
"name": "news",
"options": {
"freshnessOptions": {
"freshnessDuration": "259200s", # 3 days
}
},
}
]
}
השפעה על האיכות
איכות היא מדד לדיוק ולשימושיות של
פריט. מקור נתונים יכול להכיל כמה מסמכים דומים מבחינה סמנטית, כל אחד מהם
עם רמת איכות שונה. אפשר לציין ערך איכות בין 0 ל-
1 באמצעות SearchQualityMetadata
.
פריטים עם ערכים גבוהים יותר מקבלים עלייה בדירוג ביחס לפריטים עם ערך נמוך יותר
ערכים. השתמשו בהגדרה הזו רק אם אתם צריכים להשפיע על האיכות של
שלא קשור למידע שסופק ל-Cloud Search.
לדוגמה, נניח שיש לך מקור נתונים שמכיל הטבות לעובדים
מסמכים. כדאי להשתמש בSearchQualityMetadata
כדי לשפר את הדירוג של
מסמכים שנכתבו על ידי עובדי משאבי אנוש על פני מסמכים שנכתבו על ידי אחרים
עובדים.
בהמשך מוצגת סכימה לדוגמה שמכילה הגדרות של SearchQualityMetadata
עבור
במערכת למעקב אחר באגים:
{
"name": "datasources/.../items/issue1",
"acl": {
...
},
"metadata": {
"title": "Issue 1"
"objectType": "issues"
},
...
}
{
"name": "datasources/.../items/issue2",
"acl": {
...
},
"metadata": {
"title": "Issue 2"
"objectType": "issues"
"searchQualityMetadata": {
"quality": 0.5
}
},
...
}
{
"name": "datasources/.../items/issue3",
"acl": {
...
},
"metadata": {
"title": "Issue 3"
"objectType": "issues"
"searchQualityMetadata": {
"quality": 1
}
},
...
}
על סמך הסכימה הזו, כשמשתמש מבצע חיפוש באמצעות מונח החיפוש "בעיה", בעיה 3 בסכימה (איכות של 1) מדורגת גבוה יותר מבעיה 2 (איכות של 0 .5) ובעיה 1 (אם לא צוין דבר, איכות ברירת המחדל היא 0).
השפעה באמצעות סוג השדה
Cloud Search מאפשר לך להשפיע על הדירוג על סמך הערך של enum או
של מספרים שלמים. לכל מאפיין של מספר שלם או enum, הפונקציה
OrderedRanking
. הגדרה זו כוללת את הערכים הבאים:
NO_ORDER
(ברירת מחדל): הנכס לא משפיע על הדירוג.ASCENDING
: פריטים עם ערכים גבוהים יותר במאפיין המספר השלם או במאפיין 'טיפוסים בני מנייה (enum)' מקבלים עלייה בדירוג בהשוואה לפריטים עם ערכים נמוכים יותר.DESCENDING
: פריטים עם ערכים נמוכים יותר במאפיין המספר השלם או במאפיין enum מקבלים עלייה בדירוג בהשוואה לפריטים עם ערכים גבוהים יותר.
לדוגמה, נניח שלכל באג במערכת למעקב אחר באגים יש מאפיין enum עבור
שמירת העדיפות של הבאג בתור HIGH
(1), MEDIUM
(2) או LOW
(3). בתרחיש הזה, הגדרה של OrderedRanking
של DESCENDING
מספקת
עלייה בדירוג ל-HIGH
באגים בעדיפות גבוהה בהשוואה ל-LOW
באגים בעדיפות גבוהה.
בהמשך מוצגת סכימה לדוגמה שמכילה הגדרות של OrderedRanking
לבעיות ב
מערכת למעקב אחרי באגים:
{
"objectDefinitions": [
{
"name": "issues",
"options": {
"freshnessOptions": {
"freshnessProperty": "duedate",
}
},
"propertyDefinitions": [
{
"name": "summary",
"textPropertyOptions": {
"retrievalImportance": {
"importance": HIGHEST
}
}
},
{
"name": "duedate",
"datePropertyOptions": {
}
},
{
"name": "priority",
"enumPropertyOptions": {
"possibleValues": [
{
"stringValue": "HIGH",
"integerValue": 1
},
{
"stringValue": "MEDIUM",
"integerValue": 2
},
{
"stringValue": "LOW",
"integerValue": 3
}
],
"orderedRanking": DESCENDING,
}
},
...
]
}
]
}
מערכת למעקב אחר באגים יכולה להשתמש גם בנכס מסוג מספר שלם בשם votes
כדי
לקבל משוב ממשתמשים לגבי החשיבות היחסית של באג. אפשר להשתמש
את הנכס votes
כדי להשפיע על הדירוג באמצעות חשיבות גבוהה יותר
באגים עם הכי הרבה הצבעות. במקרה הזה, אפשר לציין
OrderedRanking
בתור ASCENDING
לנכס votes
כך שיהיו בעיות עם הכי הרבה הצבעות
מקבלים עלייה בדירוג. בהמשך מוצגת סכימה לדוגמה שמכילה OrderedRanking
עבור בעיות במערכת למעקב אחר באגים:
{
"objectDefinitions": [
{
"name": "issues",
"propertyDefinitions": [
{
"name": "summary",
"textPropertyOptions": {
"retrievalImportance": {
"importance": HIGHEST
}
}
},
{
"name": "description",
"textPropertyOptions": {
"retrievalImportance": {
"importance": DEFAULT
}
}
},
{
"name": "votes",
"integerPropertyOptions": {
"orderedRanking": ASCENDING,
"minimumValue": 0,
"maximumValue": 1000,
}
},
...
]
}
]
}
השפעה על הדירוג באמצעות הרחבת שאילתה
הרחבת שאילתות מתייחסת להרחבת המונחים בשאילתה, באמצעות מילים נרדפות איות, כדי לאחזר תוצאות טובות יותר.
שימוש במילים נרדפות כדי להשפיע על תוצאות החיפוש
Cloud Search משתמש במילים נרדפות שנגזרות מתוכן אינטרנט ציבורי כדי להרחיב מונחי השאילתה. תוכלו גם להגדיר מילים נרדפות מותאמות אישית מונחים ספציפיים לארגון, כמו ראשי תיבות נפוצים או מונחים ספציפיים לתעשייה.
ניתן להגדיר מילים נרדפות בהתאמה אישית במקור נתונים או כנתונים נפרדים מקור. כברירת מחדל, מילים נרדפות מוחלות על כל מקורות הנתונים בכל החיפושים תרגום מכונה. עם זאת, ניתן לקבץ מילים נרדפות לפי מקור נתונים של אפליקציית החיפוש. למידע על הגדרת מילים נרדפות מותאמות אישית, כולל קיבוץ לפי אפליקציית חיפוש, להגדיר מילים נרדפות.
שימוש באיות כדי להשפיע על תוצאות החיפוש
Cloud Search מספק הצעות איות המבוססות על מודלים שפותחו באמצעות
הנתונים הציבוריים של חיפוש Google. אם Cloud Search מזהה שגיאת איות בהקשר
של שאילתה, היא מחזירה את השאילתה המוצעת
SpellResult
אפשר להציג למשתמש את האיות שהוצע כהצעה. עבור
לדוגמה, המשתמש עשוי לאיית בצורה שגויה את מונח השאילתה "employe" ולקבל את הפונקציה
הצעה "האם התכוונת לעובד?"
Cloud Search משתמש גם בתיקוני איות כמילים נרדפות כדי לעזור באחזור מסמכים אחרת, עלולים להתעלם בגלל שגיאת איות.
השפעה על הדירוג דרך ההגדרות של אפליקציית החיפוש
כפי שצוין מבוא ל-Google Cloud Search, אפליקציה היא קבוצה של הגדרות שכאשר הן משויכות לחיפוש מספקים מידע הקשרי על חיפושים. הבאים הגדרות אישיות מאפשרות לכם להשפיע על הדירוג באמצעות אפליקציית החיפוש:
- הגדרות הניקוד
- הגדרת המקור
שני הקטעים הבאים מסבירים איך ההגדרות האישיות האלה שימושיות השפעה על הדירוג.
שינוי הגדרות הציון
לכל אפליקציית חיפוש אפשר לציין ScoringConfig משמש לשליטה על היישום של אותות מסוימים במהלך הדירוג. נכון לעכשיו, אפשר להשבית את העדכניות וההתאמה האישית.
אם עדכניות מושבתת, היא מושבתת לכל מקורות הנתונים שרשומים של Google, ללא קשר לאפשרויות העדכניות שצוינו בסכימה. של מקור הנתונים. באופן דומה, אם ההתאמה האישית מושבתת, הבעלים של העסק ההגדלה אינטראקציה לא משפיעה על הדירוג.
להוראות מפורטות לגבי קביעת ההגדרה הזו, עיינו במאמר התאמה אישית של חוויית החיפוש ב-Cloud Search
שינוי של הגדרת המקור
הגדרת המקור מאפשרת לך לציין הגדרות ברמת מקור הנתונים של אפליקציית החיפוש. ההגדרות הבאות נתמכות:
- חשיבות המקור
- קיבוץ באשכולות
הגדרת חשיבות למקור
חשיבות המקור מתייחסת לחשיבות היחסית של מקור נתונים בתוך
של אפליקציית החיפוש. אפשר לציין את ההגדרה הזו בשדה SourceImportance
בתוך
SourceScoringConfig
.
פריטים ממקור נתונים עם חשיבות למקור של HIGH
מקבלים עלייה בדירוג
בהשוואה לפריטים ממקור נתונים עם מקור הנתונים DEFAULT
או LOW
בחשיבותו. ההגדרה הזו יכולה להשפיע על הדירוג במקרים שבהם לדעתך המשתמשים
להעדיף תוצאות ממקורות נתונים מסוימים.
לדוגמה, נניח שיש לך פורטל תמיכה של מוצרים שמכיל נתונים של נתונים פנימיים לפתרון בעיות. בתרחיש הזה, יכול להיות שתרצו להגדיר כדי לתעדף תוצאות ממקור הנתונים הפנימי.
להוראות מפורטות לגבי קביעת ההגדרה הזו, עיינו במאמר התאמה אישית של חוויית החיפוש ב-Cloud Search
הגדרת צפיפות
צפיפות היא המספר המקסימלי של תוצאות שאפשר להחזיר
מקור נתונים באפליקציית חיפוש. הערך הזה
אפשר לשנות את ההגדרות האלה באמצעות השדה numResults
ב-
SourceCrowdingConfig
.
ערך ברירת המחדל של הערך הזה הוא 3, כלומר אם הצגנו 3 תוצאות מנתונים
המקור ב-Cloud Search מתחיל להציג תוצאות ממקורות נתונים אחרים. פריטים
ממקור הנתונים הראשון אנחנו שוקלים מחדש רק אם כל מקורות הנתונים
הגיעו למגבלת הדחיסה או שאין יותר תוצאות מנתונים אחרים
מקורות מידע.
ההגדרה הזו עוזרת להבטיח את המגוון של תוצאות החיפוש למנוע ממקור נתונים אחד לשלוט בדף תוצאות החיפוש.
להוראות מפורטות לגבי קביעת ההגדרה הזו, עיינו במאמר התאמה אישית של חוויית החיפוש ב-Cloud Search
השפעה על הדירוג באמצעות התאמה אישית
התאמה אישית: הצגה של תוצאות חיפוש בהתאמה אישית על סמך המשתמש המסוים שניגש לתוצאה. אפשר להשפיע על הדירוג על ידי תעדוף פריטים על סמך הקריטריונים הבאים:
- בעלות על פריט
- אינטראקציה עם הפריט
- קליקים של משתמשים
- שפת הפריט
שלושת הקטעים הבאים מתארים איך להשפיע על איכות החיפוש קריטריונים אלה.
השפעה על הדירוג לפי בעלות על פריט
בעלות על פריטים מתייחסת להעלאת הדירוג של פריטים שנמצאים בבעלות המשתמש.
ביצוע שאילתת החיפוש. לכל פריט יש
ItemAcl
עם השדה owners
. אם המשתמש ששולח שאילתה הוא הבעלים של פריט,
ואז, כברירת מחדל, הפריט מקבל עלייה בדירוג. אפשר להפוך
את ההתאמה האישית באפליקציית החיפוש.
ניתן להעלות את הדירוג על סמך אינטראקציה עם הפריט
אינטראקציה עם פריטים מתייחסת לשיפור הדירוג של פריטים שהחיפוש שאילתה שהמשתמש יצר איתה אינטראקציה (צפה, הגיב, נערך וכן הלאה).
אותות אינטראקציה של פריטים מתקבלים באופן אוטומטי עבור Google Workspace כגון Drive ו-Gmail. עבור מוצרים אחרים, אפשר לציין ברמת הפריט אינטראקציה כולל סוג האינטראקציה (צפייה, עריכה), חותמת הזמן אינטראקציה, וחשבון המשתמש (המשתמש שהייתה לו אינטראקציה עם הפריט). שימו לב פריטים עם אינטראקציות אחרונות מקבלים דירוג גבוה יותר.
הגדלת הדירוג בהתאם לקליקים של המשתמשים
מערכת Cloud Search אוספת את הקליקים על תוצאות החיפוש הנוכחיות ומשתמשת בהם כדי לשפר את הדירוג בחיפושים עתידיים על ידי הגדלת הפריטים שעליהם לחץ המשתמש בעבר אותו משתמש.
השפעה על הדירוג באמצעות פרשנות שאילתה
התכונה פרשנות שאילתה של Cloud Search מפרשת באופן אוטומטי את ומסננים בשאילתת החיפוש של המשתמש, וממירים את הרכיבים האלה שאילתה מובנית ומבוססת-אופרטורים. פרשנות השאילתה משתמשת באופרטורים מוגדרים בסכימה, יחד עם המסמכים שנוספו לאינדקס, כדי להסיק פירוש השאילתה. התכונה הזו מאפשרת למשתמש לחפש עם מילות מפתח, אבל עדיין להשיג תוצאות מדויקות. לקבלת מידע נוסף, אפשר לעיין במאמר בנושא בניית סכימה לפירוש שאילתות אופטימלי.
הגדלת הדירוג על סמך שפת הפריט
שפה מתייחסת להורדה בדרגה של פריטים שהשפה שלהם לא תואמים לשפת השאילתה. הגורמים הבאים משפיעים על הדירוג של פריטים על סמך שפה:
שפת השאילתה. השפה של שאילתת החיפוש שזוהתה באופן אוטומטי, או
languageCode
שצויןRequestOptions
.אם אתם יוצרים ממשק חיפוש מותאם אישית, עליכם להגדיר את
languageCode
כך: שפת הממשק או העדפת השפה של המשתמש (לדוגמה, השפה של דפדפן האינטרנט או דף ממשק החיפוש). השאילתה שזוהתה באופן אוטומטי השפה מקבלת עדיפות על פניlanguageCode
, כך שאיכות החיפוש נפגע כשמשתמש מקליד שאילתה בשפה ששונה מזו גרפי.שפת הפריט. הערך
contentLanguage
מוגדר ב-ItemMetadata
בזמן האינדקס, או שפת התוכן שזוהתה באופן אוטומטי על ידי Cloud Search.אם השדה
contentLanguage
של המסמך נשאר ריק בזמן האינדקס, וגם השדהItemContent
מאוכלס, Cloud Search מנסה לזהות את השפה שנמצא בשימוש ב-ItemContent
ומאחסן אותו באופן פנימי. הערכים שזוהה באופן אוטומטי השפה לא נוספה לשדהcontentLanguage
.
אם שפת השאילתה והפריט תואמים, לא תחול הורדת שפה. אם המיקום
הגדרות אלה אינן תואמות, לאחר מכן הפריט יורד בדרגה. הורדת השפה בדרגה היא לא
הוחלו על מסמכים שבהם הקובץ contentLanguage
ריק ולא ניתן היה להשתמש ב-Cloud Search
לזהות את השפה באופן אוטומטי. כתוצאה מכך, הדירוג של מסמך לא
מושפעת אם Cloud Search לא יוכל לזהות את השפה שלו.
ניתן לשפר את הדירוג על סמך ההקשר של הפריט
אפשר לשפר את הדירוג של פריטים שרלוונטיים יותר להקשר.
של שאילתת החיפוש. ההקשר
(contextAttributes
)
היא קבוצה של מאפיינים בעלי שם שניתן לציין במהלך ההוספה לאינדקס,
בקשה לחיפוש, כדי לספק הקשר לשאילתת חיפוש ספציפית.
לדוגמה, נניח שפריט, כגון מסמך הטבות לעובד, רלוונטי יותר
רלוונטיות בהקשר של Location
וDepartment
, כמו עיר
(San Francisco
), מדינה (California
), מדינה (USA
) וגם Department
(Engineering
). במקרה כזה, ניתן להוסיף את הפריט לאינדקס עם ההגדרות הבאות
מאפיינים בעלי שם:
{
...
"metadata": {
"contextAttributes": [
{
name: "Location"
values: [
"San Francisco",
"California",
"USA"
],
},
{
name: "Department"
values: [
"Engineering"
],
}
],
},
...
}
כשהמשתמש יזין את שאילתת החיפוש "הטבות". בממשק החיפוש, עשוי לכלול את פרטי המיקום של המשתמש ואת המחלקה שלו בחיפוש בקשה. לדוגמה, הנה בקשת חיפוש שמכילה מיקום ומחלקה מידע למהנדסים בשיקגו:
{
...
"contextAttributes": [
{
name: "Location"
values: [
"Chicago",
"Illinois",
"USA"
],
},
{
name: "Department"
values: [
"Engineering"
],
}
],
...
}
כי גם הפריט שנוסף לאינדקס וגם בקשת החיפוש מכילים את המאפיינים של "מחלקה=הנדסה" ו-"Location=USA," הפריט שנוסף לאינדקס (עובד מופיע במיקום גבוה יותר בתוצאות החיפוש.
עכשיו נניח שמשתמש אחר, מהנדס בהודו, מזין שאילתת חיפוש של "יתרונות" לממשק החיפוש. לפניכם בקשת חיפוש שמכילה מיקום ומידע על מחלקה:
{
...
"contextAttributes": [
{
name: "Location"
values: [
"Bengaluru",
"Karnataka",
"India"
],
},
{
name: "Department"
values: [
"Engineering"
],
}
],
...
}
כי גם הפריט שנוסף לאינדקס וגם בקשת החיפוש רק מכילים את של "מחלקה=Engineering", הפריט שנוסף לאינדקס מופיע רק במעט גבוה יותר בתוצאות החיפוש (בהשוואה לשאילתת החיפוש הראשונה של "יתרונות" שהוזנו על ידי מהנדס משיקגו, אילינוי ארה"ב).
הנה כמה הקשרים לדוגמה שכדאי להשתמש בהם כדי לשפר את הדירוג:
- מיקום: הפריטים יכולים להיות רלוונטיים יותר למשתמשים במיקום מסוים, כמו בניין, עיר, מדינה או אזור.
- תפקיד מסוים: הפריטים יכולים להיות רלוונטיים יותר למשתמשים בתפקיד מסוים, כמו כותבים טכניים או מהנדסי תוכנה.
- מחלקה: הפריטים יכולים להיות רלוונטיים יותר למחלקות מסוימות, כמו 'מכירות' או 'שיווק'.
- רמת התפקיד: הפריטים יכולים להיות רלוונטיים יותר לתפקידים מסוימים, כמו דירקטור או מנכ"ל.
- סוג העובדים: הפריטים יכולים להיות רלוונטיים יותר לסוגים מסוימים של עובדים, כמו עובדים במשרה חלקית ועובדים במשרה מלאה.
- ותק: הפריטים עשויים להיות רלוונטיים יותר למותק של העובד, כמו העסקת עובדים חדשים.
השפעה על הדירוג באמצעות הפופולריות של פריטים
Cloud Search משפר את הדירוג של פריטים פופולריים; כלומר, הוא מגדיל את הפריטים שקיבלו קליקים בשאילתות חיפוש אחרונות.
השפעה על הדירוג באמצעות clickboost
ב-Cloud Search נאספים נתוני קליקים על תוצאות חיפוש קיימות, והמערכת משתמשת בהם כדי לשפר את הדירוג בחיפושים עתידיים על ידי הגדלת הפריטים הפופולריים בתגובה לשאילתת חיפוש מסוימת.
סיכום של הגדרות מומלצות ואופציונליות של איכות החיפוש
הטבלה הבאה מפרטת את כל איכות החיפוש המומלצת והאופציונלית הגדרות. ההמלצות האלה אמורות לעזור לך להפיק את המקסימום המודלים של הדירוג ב-Cloud Search.
הגדרה | מיקום | מומלץ/אופציונלי | פרטים |
---|---|---|---|
הגדרות סכימה | |||
השדה ItemContent | ItemContent | מומלץ | כשיוצרים או מעדכנים את הסכימה, צריך לאכלס את התוכן הלא מובנה של פריט. השדה הזה משמש ליצירת נכסי מידע מובנה. |
השדה RetrievalImportance | RetrievalImportance | מומלץ | כשיוצרים או מעדכנים סכימה, חשוב להגדיר מאפייני טקסט שיש להם בבירור חשיבות או נושאים מרכזיים. |
FreshnessOptions | FreshnessOptions | אופציונלי | כשיוצרים או מעדכנים סכימה, חשוב לוודא שפריטים לא יורדים בדרגה בגלל נתונים שגויים או במקרים שבהם חסרים נתונים. |
הגדרות הוספה לאינדקס | |||
createTime /updateTime | ItemMetadata | מומלץ | אכלוס פריט בזמן ההוספה לאינדקס. |
contentLanguage | ItemMetadata | מומלץ | אכלוס פריט בזמן ההוספה לאינדקס. אם השדה חסר, Cloud Search ינסה לזהות את השפה שבה נעשה שימוש בItemContent . |
השדה owners | ItemAcl() | מומלץ | אכלוס פריט בזמן ההוספה לאינדקס. |
מילים נרדפות בהתאמה אישית | סכימה אחת (_dictionaryEntry ) | מומלץ | ניתן להגדיר ברמת מקור הנתונים או כמקור נתונים נפרד במהלך ההוספה לאינדקס. |
השדה quality | SearchQualityMetadata | אופציונלי | כדי לשפר את האיכות הבסיסית בהשוואה לפריטים דומים מבחינה סמנטית, כדאי להגדיר את האיכות במהלך ההוספה לאינדקס. אם מגדירים את השדה הזה לכל הפריטים במקור נתונים, ההשפעה שלו תתבטל. |
נתוני אינטראקציות ברמת הפריט | interaction | אופציונלי | אם מקור הנתונים מתעד את האינטראקציות של המשתמש ומספק גישה, צריך לאכלס את האינטראקציות עבור כל פריט במהלך ההוספה לאינדקס. |
מאפייני מספר שלם/טיפוסים בני מנייה (enum) | OrderedRanking | אופציונלי | אם סדר הפריטים רלוונטי, צריך לציין את הדירוג הסדיר של מאפייני מספר שלם ו-enum במהלך ההוספה לאינדקס. |
הגדרות של אפליקציית חיפוש | |||
Personalization=false | ScoringConfig או באמצעות ממשק המשתמש לניהול של CloudSearch | מומלץ | כשיוצרים או מעדכנים את אפליקציית החיפוש. יש לספק את פרטי הבעלים הנכונים כפי שמתואר בנושא השפעה על הדירוג באמצעות התאמה אישית |
השדה SourceImportance | SourceCrowdingConfig | אופציונלי | כדי להטות את התוצאות ממקורות נתונים מסוימים, צריך להגדיר את השדה הזה. |
השדה numResults | SourceCrowdingConfig | אופציונלי | כדי לשלוט במגוון התוצאות, צריך להגדיר את השדה הזה. |
השלבים הבאים
אפשר לנסות את הפתרונות הבאים:
ללמוד איך להשתמש סכימה
_dictionaryEntry
להגדרה מילים נרדפות למונחים נפוצים בחברה שלכם. כדי להשתמש_dictionaryEntry
מתייחסים הגדרת מילים נרדפות.