הדף הזה מתייחס לגרסת ה-XML של ממשק ה-API של Custom Search JSON, שזמין רק ללקוחות Google Site Search.
- סקירה כללית
- פורמט הבקשה של Programmable Search Engine
- תוצאות XML
סקירה כללית
שירות Google WebSearch מאפשר ללקוחות של 'חיפוש באתר' של Google להציג את תוצאות החיפוש של Google באתרי האינטרנט שלהם. שירות WebSearch משתמש בפרוטוקול פשוט מבוסס HTTP כדי להגיש תוצאות חיפוש. לאדמינים של חיפוש יש שליטה מלאה על האופן שבו הם מבקשים תוצאות חיפוש ועל האופן שבו הם מציגים את התוצאות למשתמש הקצה. מסמך זה מתאר את הפרטים הטכניים של בקשת החיפוש ב-Google והפורמטים של התוצאות.
כדי לאחזר את התוצאות של Google WebSearch, האפליקציה שולחת ל-Google בקשת HTTP פשוטה. לאחר מכן Google מחזירה את תוצאות החיפוש בפורמט XML. תוצאות בפורמט XML מאפשרות לך להתאים אישית את האופן שבו תוצאות החיפוש מוצגות.
פורמט בקשה של WebSearch
- סקירה כללית של הבקשה
- תנאי השאילתה
- הפרמטרים של הבקשה
- שאילתות לדוגמה ב-WebSearch
- הגדרות של פרמטרים של שאילתות לחיפוש באינטרנט
- שאילתות על תמונה לדוגמה
- הגדרות של פרמטרים של שאילתות חיפוש תמונות
- חיפוש מתקדם
- פרמטרים של שאילתה בחיפוש מתקדם
- מונחי שאילתה מיוחדים
- מגבלות על בקשות
סקירה כללית של הבקשה
הבקשה של חיפוש Google היא פקודת HTTP GET
רגילה. הדוח
כולל אוסף של פרמטרים שרלוונטיים
לשאילתות שלך. הפרמטרים האלה כלולים בכתובת ה-URL של הבקשה כצמדים של שם=ערך, שמופרדים באמצעות תווי אמפרסנד (&). הפרמטרים כוללים נתונים כמו שאילתת החיפוש ומזהה מנוע ייחודי (cx
) שמזהה את המנוע ששולח את בקשת ה-HTTP. שירות WebSearch או Image Search מחזיר תוצאות XML בתגובה לבקשות ה-HTTP שלך.
מונחי השאילתה
רוב בקשות החיפוש כוללות מונח שאילתה אחד או יותר. מונח שאילתה מופיע כערך של פרמטר בבקשת החיפוש.
מונחי שאילתה יכולים לציין כמה סוגי מידע, כדי לסנן ולארגן את תוצאות החיפוש ש-Google מחזירה. שאילתות יכולות לציין את הפרטים הבאים:
- מילים או ביטויים להכללה או להחרגה
- כל המילים בשאילתת חיפוש (ברירת מחדל)
- ביטוי מדויק בשאילתת החיפוש
- כל מילה או ביטוי בשאילתת חיפוש
- איפה במסמך יש לחפש
את מונחי החיפוש
- בכל מקום במסמך (ברירת מחדל)
- רק בגוף המסמך
- רק בכותרת המסמך
- רק בכתובת ה-URL של המסמך
- רק בקישורים במסמך
- הגבלות על המסמכים עצמם
- הכללה או החרגה של מסמכים מסוגי קבצים מסוימים (כמו קובצי PDF או מסמכי Word)
- שאילתות מיוחדות על כתובות URL שמחזירה
מידע על כתובת URL נתונה, במקום לבצע חיפוש
- שאילתות שמחזירות מידע כללי על כתובת URL, כמו הקטגוריה, קטע הקוד או השפה שלה ב-Open Directory
- שאילתות שמחזירות קבוצת דפי אינטרנט שמקשרים לכתובת URL
- שאילתות שמחזירות קבוצה של דפי אינטרנט שדומים לכתובת URL נתונה
חיפוש ברירת מחדל
צריך לסמן את כתובת ה-URL בתו בריחה (escape) בערכי הפרמטרים של שאילתות החיפוש. חשוב לזכור שצריך להחליף את סימן הפלוס ("+") בכל רצפי רווחים לבנים בשאילתת החיפוש. נושא זה נדון לעומק בקטע העברה של כתובת אתר להתעלמת כתובת אתר במסמך זה.
מונח שאילתת החיפוש נשלח לשירות WebSearch באמצעות הפרמטר q. דוגמה למונח של שאילתת חיפוש:
q=horses+cows+pigs
כברירת מחדל, שירות Google WebSearch מחזיר רק מסמכים הכוללים את כל המונחים שבשאילתת החיפוש.
הפרמטרים של הבקשה
בקטע הזה מפורטים הפרמטרים שניתן להשתמש בהם לשליחת בקשת חיפוש. הפרמטרים מחולקים לשתי רשימות. הרשימה הראשונה מכילה פרמטרים שרלוונטיים לכל בקשות החיפוש. הרשימה השנייה מכילה פרמטרים שרלוונטיים רק לבקשות של חיפוש מתקדם.
נדרשים שלושה פרמטרים של בקשה:
- הפרמטר client חייב להיות מוגדר ל-
google-csbe
- הפרמטר output מציין את הפורמט של תוצאות ה-XML שהוחזרו. ניתן להחזיר את התוצאות עם (xml)
או בלי (
xml_no_dtd
) הפניה ל-DTD של Google. מומלץ להגדיר את הערך הזה כ-xml_no_dtd
. הערה: אם לא מציינים את הפרמטר הזה, התוצאות יוחזרו ב-HTML במקום ב-XML.
- הפרמטר cx שמייצג את המזהה הייחודי של המנוע.
הפרמטרים הנפוצים ביותר של בקשות, מלבד אלה שצוינו למעלה, הם:
שאילתות WebSearch לדוגמה
הדוגמאות הבאות מציגות מספר בקשות HTTP של WebSearch כדי להמחיש את אופן השימוש בפרמטרים שונים של שאילתות. הגדרות לפרמטרים השונים של שאילתות מופיעות בקטעים הגדרות של פרמטרים של שאילתות ב-WebSearch ופרמטרים של שאילתות חיפוש מתקדם במסמך זה.
הבקשה הזו מבקשת את 10 התוצאות הראשונות (start=0&num=10
)
עבור מונח השאילתה "red sox" (q=red+sox
). השאילתה מציינת גם שהתוצאות צריכות להגיע מאתרי אינטרנט קנדיים (cr=countryCA
)
ושהן צריכות להיכתב בצרפתית (lr=lang_fr
). לבסוף, השאילתה מציינת ערכים לפרמטרים client, output,
ו-cx, ושלושת התוצאות האלה נדרשים.
http://www.google.com/search?
start=0
&num=10
&q=red+sox
&cr=countryCA
&lr=lang_fr
&client=google-csbe
&output=xml_no_dtd
&cx=00255077836266642015:u-scht7a-8i
בדוגמה הזו נעשה שימוש בחלק מהפרמטרים של שאילתות החיפוש המתקדם כדי להתאים אישית אף יותר את שאילתת החיפוש. בבקשה הזו נעשה שימוש בפרמטר as_q (as_q=red+sox
) במקום בפרמטר q. המערכת משתמשת גם בפרמטר
as_eq כדי להחריג מסמכים שמכילים את המילה "Yankees"
מתוצאות החיפוש (as_eq=yankees
).
http://www.google.com/search?
start=0
&num=10
&as_q=red+sox
&as_eq=Yankees
&client=google-csbe
&output=xml_no_dtd
&cx=00255077836266642015:u-scht7a-8i
הגדרות פרמטר שאילתה של WebSearch
c2coff | |||||||
---|---|---|---|---|---|---|---|
תיאור | אופציונלי. הפרמטר c2coff מפעיל או משבית את התכונה חיפוש בסינית פשוטה ומסורתית. ערך ברירת המחדל של הפרמטר הזה הוא
|
||||||
דוגמאות | q=google&c2coff=1 |
לקוח | |
---|---|
תיאור | נדרש. הפרמטר |
דוגמאות | q=google&client=google-csbe |
cr | |
---|---|
תיאור | אופציונלי. הפרמטר המערכת של Google WebSearch קובעת את המדינה של מסמך באמצעות ניתוח של:
בקטע Country (cr) Parameter values מופיעה רשימה של ערכים חוקיים לפרמטר הזה. |
דוגמאות | q=Frodo&cr=countryNZ |
cx | |
---|---|
תיאור | נדרש. הפרמטר |
דוגמאות | q=Frodo&cx=00255077836266642015:u-scht7a-8i |
סינון | |||||||
---|---|---|---|---|---|---|---|
תיאור | אופציונלי. הפרמטר filter מפעיל או משבית את הסינון האוטומטי של תוצאות החיפוש ב-Google. אפשר לקרוא מידע נוסף על המסננים של תוצאות החיפוש של Google בקטע סינון אוטומטי במסמך הזה. ערך ברירת המחדל של הפרמטר
הערה: כברירת מחדל, Google מחילה סינון על כל תוצאות החיפוש כדי לשפר את האיכות של התוצאות האלה. |
||||||
דוגמאות | q=google&filter=0 |
gl | |
---|---|
תיאור | אופציונלי. ערך הפרמטר ציון ערך פרמטר |
דוגמאות | הבקשה הזו מרחיבה את היקף המסמכים שנכתבו בבריטניה
בתוצאות של WebSearch: |
hl | |
---|---|
תיאור | אופציונלי. הפרמטר לקבלת מידע נוסף, עיינו בקטע שפות הממשק במאמר Internationalizing שאילתות והצגת תוצאות. לקבלת מידע נוסף, ניתן לעיין בשפות ממשק נתמכות לקבלת רשימה של שפות נתמכות. |
דוגמאות | בקשה זו מטרגטת מודעות ליין בצרפתית. (Vin הוא המונח בצרפת ליין). q=vin&ip=10.10.10.10&ad=w5&hl=fr |
hq | |
---|---|
תיאור | אופציונלי. הפרמטר |
דוגמאות | בקשה זו מחפשת גם 'פיצה' וגם 'גבינה'. הביטוי זהה ל-
|
ie | |
---|---|
תיאור | אופציונלי. הפרמטר עיין בקטע קידוד תווים לדיון לגבי המקרים שבהם ייתכן שיהיה צורך להשתמש בפרמטר זה. בקטע סכימות קידוד תווים מוצגת רשימה של ערכי |
דוגמאות | q=google&ie=utf8&oe=utf8 |
lr | |
---|---|
תיאור | אופציונלי. הפרמטר מערכת Google WebSearch קובעת את השפה של מסמך באמצעות הניתוח של:
בקטע שפה ( |
דוגמאות | q=Frodo&lr=lang_en |
num | |
---|---|
תיאור | אופציונלי. הפרמטר ערך ברירת המחדל של הערה: אם המספר הכולל של תוצאות החיפוש נמוך ממספר התוצאות המבוקש, יוחזרו כל תוצאות החיפוש הזמינות. |
דוגמאות | q=google&num=10 |
oe | |
---|---|
תיאור | אופציונלי. הפרמטר עיין בקטע קידוד תווים לדיון לגבי המקרים שבהם ייתכן שיהיה צורך להשתמש בפרמטר זה. בקטע סכימות קידוד תווים מוצגת רשימה של ערכי |
דוגמאות | q=google&ie=utf8&oe=utf8 |
output | |||||||
---|---|---|---|---|---|---|---|
תיאור | נדרש. הפרמטר
|
||||||
דוגמאות | output=xml_no_dtd |
q | |
---|---|
תיאור | אופציונלי. הפרמטר יש גם כמה מונחי שאילתה מיוחדים שאפשר
להשתמש בהם כחלק מערך הפרמטר לוח הבקרה של חיפוש Google כולל דוח של השאילתות המובילות שנשלחו באמצעות הפרמטר הערה: הערך שמצוין לפרמטר q חייב להיות מסומן בתו בריחה (escape) של כתובת URL. |
דוגמאות | q=vacation&as_oq=london+paris |
בטיחות | |||||||||
---|---|---|---|---|---|---|---|---|---|
תיאור | אופציונלי. הפרמטר
מידע נוסף על התכונה הזו זמין בקטע סינון תוכן למבוגרים בלבד באמצעות חיפוש בטוח. |
||||||||
דוגמאות | q=adult&safe=high |
התחלה | |
---|---|
תיאור | אופציונלי. הפרמטר הפרמטר |
דוגמאות | start=10 |
מיון | |
---|---|
תיאור | אופציונלי. הפרמטר |
דוגמאות |
|
U | |
---|---|
תיאור | אופציונלי. הפרמטר http://www.花井鮨.com הערכים החוקיים לפרמטר הזה הם אם הפרמטר http://www.xn--elq438j.com. הערה: זוהי תכונת בטא. |
דוגמאות | q=google&ud=1 |
חיפוש מתקדם
הפרמטרים הנוספים של השאילתות שמפורטים מתחת לתמונה רלוונטיים לשאילתות של חיפוש מתקדם. כששולחים חיפוש מתקדם, כל הערכים של מספר פרמטרים (למשל as_eq, as_epq, as_oq וכו') משוקללים במונחי השאילתה עבור אותו חיפוש. בתמונה מוצג הדף 'חיפוש מתקדם' של Google. בתמונה, השם של כל פרמטר של חיפוש מתקדם כתוב בטקסט red בתוך השדה בדף שאליו הפרמטר הזה תואם או לידו.
פרמטרים של שאילתות לחיפוש מתקדם
as_dt | |
---|---|
תיאור | אופציונלי. הפרמטר |
דוגמאות | as_dt=i,as_dt=e |
as_epq | |
---|---|
תיאור | אופציונלי. הפרמטר |
דוגמאות | as_epq=abraham+lincoln |
as_eq | |
---|---|
תיאור | אופציונלי. הפרמטר |
דוגמאות |
|
as_lq | |
---|---|
תיאור | אופציונלי. הפרמטר |
דוגמאות |
|
as_nlo | |
---|---|
תיאור | אופציונלי. הפרמטר |
דוגמאות | בטבלה הבאה מוגדר טווח חיפוש של 5 עד 10, כולל:
|
as_nhi | |
---|---|
תיאור | אופציונלי. הפרמטר |
דוגמאות | בטבלה הבאה מוגדר טווח חיפוש של 5 עד 10, כולל:
|
as_oq | |
---|---|
תיאור | אופציונלי. הפרמטר |
דוגמאות |
|
as_q | |
---|---|
תיאור | אופציונלי. הפרמטר |
דוגמאות |
|
as_qdr | |
---|---|
תיאור | אופציונלי. הפרמטר
התקבלה בקשה מ- |
דוגמאות |
בדוגמה הזו מוצגות בקשות מהשנה האחרונה:
בדוגמה הזו מוצגות בקשות מ-10 הימים האחרונים:
|
as_sitesearch | |
---|---|
תיאור | אופציונלי. הפרמטר |
דוגמאות |
|
מונחי שאילתה מיוחדים
Google WebSearch מאפשר להשתמש במספר מונחי שאילתה מיוחדים, המעניקים גישה ליכולות נוספות של מנוע החיפוש של Google. התנאים של השאילתות המיוחדות צריכים להיכלל בערך של פרמטר הבקשה q. כמו בכל מונחי שאילתה אחרים, צריך
לסמן את מונחי השאילתה המיוחדים באמצעות URL-escape. מספר
של מונחי השאילתה המיוחדים כוללים נקודתיים (:). צריך לסמן את התו הזה גם בתו בריחה (escape) של כתובת URL. הערך של תו בריחה (escape) של כתובת ה-URL הוא %3A
.
קישורים אחוריים [link:] | |
---|---|
תיאור | מונח השאילתה הגרסה של אפשר גם להשתמש בפרמטר הבקשה as_lq כדי לשלוח בקשת הערה: לא ניתן לציין מונחי שאילתה אחרים כשמשתמשים ב- |
דוגמאות |
|
ערך בוליאני OR חיפוש [ OR ] | |
---|---|
תיאור | מונח השאילתה אפשר גם להשתמש בפרמטר הבקשה as_oq כדי לחפש מונח מתוך קבוצת מונחים. הערה: אם בבקשת חיפוש מציינים את השאילתה "לונדון+OR+פריז", תוצאות החיפוש יכללו מסמכים שמכילים לפחות אחת משתי המילים האלה. במקרים מסוימים, מסמכים בתוצאות החיפוש עשויים להכיל את שתי המילים. |
דוגמאות | חיפוש לונדון או פריז: קלט של משתמשים:
london OR
paris מונח השאילתה:q=london+OR+paris מחפשים 'חופשה' ו'לונדון' או 'פריז': מונח השאילתה:
q=vacation+london+OR+paris חפש 'חופשה' ואחד מ'לונדון', 'פריז' או 'שוקולד': מונח השאילתה:
q=vacation+london+OR+paris+OR+chocolates מחפשים המונח 'חופשה' ו'שוקולדים' או 'לונדון' או 'פריז', כשנותנים את המשקל הנמוך ביותר לשוקולד: מונח השאילתה:
q=vacation+london+OR+paris+chocolates חיפוש המונח 'חופשה', 'שוקולדים' ו'פרחים' במסמכים שכוללים גם את לונדון או פריז: מונח השאילתה:
q=vacation+london+OR+paris+chocolates+flowers מחפשים 'חופשה' ואחד מ'לונדון' או 'פריז', וגם מחפשים 'שוקולד' או 'פרחים': מונח השאילתה: q=vacation+london+OR+paris+chocolates+OR+flowers |
החרגת מונח השאילתה [-] | |
---|---|
תיאור | מונח שאילתת ההחרגה ( הגרסה של מונח שאילתת ההחרגה שימושי כאשר למונח חיפוש יש יותר ממשמעות אחת. לדוגמה, המילה "בס" יכולה להחזיר תוצאות לגבי דג או מוזיקה. אם חיפשת מסמכים על דגים, יכול להיות שהיית רוצה להחריג מתוצאות החיפוש מסמכים שקשורים למוזיקה באמצעות מונח שאילתת ההחרגה. אפשר גם להשתמש בפרמטר הבקשה as_eq כדי להחריג מתוצאות החיפוש מסמכים שתואמים למילה או לביטוי מסוימים. |
דוגמאות | קלט של משתמשים: bass -music מונח שאילתה: q=bass+%2Dmusic |
אי-הכללה של סוגי קבצים [ -filetype: ] | |
---|---|
תיאור | מונח השאילתה הגרסה של הערה: אפשר להחריג כמה סוגי קבצים מתוצאות החיפוש על ידי הוספת עוד מונחי שאילתה מסוג סוגי הקבצים הנתמכים על ידי Google הם:
אפשר להוסיף סוגי קבצים נוספים בעתיד. תמיד אפשר למצוא רשימה עדכנית בשאלות הנפוצות בנושא סוגי הקבצים של Google. |
דוגמאות | בדוגמה הבאה ניתן לראות מסמכים עם המילה "Google" אך אינם
מסמכי PDF: בדוגמה הזו מוצגים מסמכים עם המילה "Google" אבל
לא כוללים מסמכי PDF ו-Words: |
סינון סוגי קבצים [ filetype: ] | |
---|---|
תיאור | מונח השאילתה הגרסה של ניתן להגביל את תוצאות החיפוש למסמכים שתואמים לאחד מסיומות הקבצים אחת על ידי הוספת עוד מונחי שאילתה מסוג כברירת מחדל, תוצאות החיפוש יכללו מסמכים עם סיומות קבצים כלשהן. סוגי הקבצים הנתמכים על ידי Google הם:
אפשר להוסיף סוגי קבצים נוספים בעתיד. תמיד אפשר למצוא רשימה עדכנית בשאלות הנפוצות בנושא סוגי הקבצים של Google. |
דוגמאות | בדוגמה הזו מוחזרות מסמכי PDF שבהם מוזכרת המילה "Google": הדוגמה הזו מחזירה מסמכי PDF ו-Word שבהם מוזכר
"Google": |
הכללת מונח שאילתה [+] | |
---|---|
תיאור | מונח השאילתה Include (+) מציין שמילה או ביטוי חייבים להופיע בכל המסמכים שנכללים בתוצאות החיפוש. כדי להשתמש במונח של שאילתת החיפוש, עליך להוסיף '+' (סימן פלוס) לפני המילה או הביטוי שחייבים להיכלל בכל תוצאות החיפוש. הגרסה של יש להשתמש ב- |
דוגמאות | קלט של משתמשים: Star Wars Episode +I מונח שאילתה: q=Star+Wars+Episode+%2BI |
קישורים בלבד חיפוש, כל המונחים [ allinlinks: ] | |
---|---|
תיאור | מונח השאילתה אם שאילתת החיפוש שלך כוללת את מונח השאילתה הגרסה של |
דוגמאות | קלט של משתמשים:allinlinks: Google search מונח שאילתה: q=allinlinks%3A+Google+search |
חיפוש ביטוי | |
---|---|
תיאור | מונח השאילתה 'חיפוש לביטוי' (") מאפשר לך לחפש ביטויים שלמים על ידי תחימה של הביטויים במירכאות או על ידי חיבורם במקפים. הגרסה של חיפושי ביטויים שימושיים במיוחד אם אתה מחפש ציטוטים מפורסמים או שמות עצם פרטיים. אפשר גם להשתמש בפרמטר הבקשה as_epq כדי לשלוח חיפוש לביטוי. |
דוגמאות | קלט של משתמשים:"Abraham Lincoln" מונח שאילתה: q=%22Abraham+Lincoln%22 |
חיפוש טקסט בלבד, כל המונחים [allintext:] | |
---|---|
תיאור | מונח השאילתה אם שאילתת החיפוש שלך כוללת את מונח השאילתה הגרסה של |
דוגמאות | בדוגמה הזו, המילים
"Google" ו-"search" חייבות להופיע בגוף של כל המסמכים שכלולים בתוצאות החיפוש: קלט של משתמש: allintext:Google search מונח השאילתה: q=allintext%3AGoogle+search |
חיפוש כותרת, מונח יחיד [intitle:] | |
---|---|
תיאור | מונח השאילתה הערה: ניתן לציין יותר ממילה אחת שחייבת להיכלל בכותרת המסמך. לשם כך, יש להוסיף את מונח השאילתה הגרסה של |
דוגמאות | בדוגמה הזו, המילה "Google" חייבת להופיע בכותרות של כל המסמכים בתוצאות החיפוש, והמילה
"search" חייבת להופיע במקום כלשהו בכותרות, בכתובות ה-URL, בקישורים או בגוף הטקסט
של המסמכים האלה: |
Title Search, כל המונחים [allintitle:] | |
---|---|
תיאור | מונח השאילתה הערה: הוספת הגרסה של |
דוגמאות | בדוגמה הזו, המילים "Google" ו-"search" חייבות להופיע בכותרות של מסמכים בתוצאות החיפוש: |
חיפוש כתובת אתר, מונח יחיד [inurl:] | |
---|---|
תיאור | מונח השאילתה מונח השאילתה הגרסה של |
דוגמאות | בדוגמה הזו, המילה "Google" חייבת להופיע בכתובות ה-URL של כל המסמכים בתוצאות החיפוש, והמילה "search" חייבת להופיע במקום כלשהו בכותרות, בכתובות ה-URL, בקישורים או בגוף הטקסט של המסמכים האלה: |
URL Search, כל המונחים [allinurl:] | |
---|---|
תיאור | מונח השאילתה מונח השאילתה הגרסה של |
דוגמאות | בדוגמה הזו מצוין שהמילים Google ו-search חייבות להופיע בכתובות ה-URL של המסמכים בתוצאות החיפוש: |
פרטי מסמך אינטרנט [info:] | |
---|---|
תיאור | מונח השאילתה הגרסה של הערה: לא ניתן לציין מונחי שאילתה אחרים כשמשתמשים ב- |
דוגמאות | קלט של משתמשים: info:www.google.com מונח שאילתה: q=info%3Awww.google.com |
שאילתות על תמונות לדוגמה
הדוגמאות הבאות מציגות שתי בקשות HTTP לתמונות כדי להמחיש את השימוש בפרמטרים שונים של שאילתה. הגדרות לפרמטרים השונים של השאילתה מופיעות בקטעים 'הגדרות של פרמטרים של שאילתות תמונה' במסמך זה.
הבקשה הזו מבקשת את 5 התוצאות הראשונות (start=0&num=5
) עבור מונח השאילתה "קוף" (q=monkey
), מסוג filetype .png. לבסוף, השאילתה מציינת ערכים עבור הפרמטרים client
, output
ו-cx
, וכל שלושת הפרמטרים נדרשים.
http://www.google.com/cse? searchtype=image start=0 &num=5 &q=monkey &as_filetype=png &client=google-csbe &output=xml_no_dtd &cx=00255077836266642015:u-scht7a-8i
פרמטרים של שאילתות לחיפוש תמונות
as_filetype | |
---|---|
תיאור | אופציונלי. מחזירה תמונות מסוג שצוין. הערכים המותרים הם: |
דוגמאות | q=google&as_filetype=png |
imgsz, imgsz | |
---|---|
תיאור | אופציונלי. מחזירה תמונות בגודל שצוין, כאשר הגודל יכול להיות אחד מהבאים:
|
דוגמאות | q=google&as_filetype=png&imgsz=icon |
imgtype | |
---|---|
תיאור | אופציונלי. הפונקציה מחזירה תמונות מסוג, שיכול להיות אחת מהאפשרויות הבאות:
|
דוגמאות | q=google&as_filetype=png&imgtype=photo |
imgc, imgc | |
---|---|
תיאור | אופציונלי. הצגת תמונות בשחור-לבן, תמונות בגווני אפור או תמונות צבעוניות:
|
דוגמאות | q=google&as_filetype=png&imgc=gray |
imgcolor | |
---|---|
תיאור | אופציונלי. מחזירה תמונות בצבע דומיננטי ספציפי:
|
דוגמאות | q=google&as_filetype=png&imgcolor=yellow |
as_rights | |
---|---|
תיאור | אופציונלי. מסננים שמבוססים על רישוי. הערכים הנתמכים כוללים:
|
דוגמאות | q=cats&as_filetype=png&as_rights=cc_attribute |
מגבלות של בקשות
בתרשים הבא מפורטות המגבלות על בקשות החיפוש שנשלחות ל-Google:
רכיב | הגבלה | תגובה |
---|---|---|
אורך בקשת חיפוש | 2,048 בייטים | |
מספר מונחי השאילתה | 10 | כולל מונחים בפרמטרים הבאים: q, as_epq, as_eq, as_lq, as_oq, as_q |
מספר התוצאות | 20 | אם מגדירים את הפרמטר num כמספר גדול מ-20, יוחזרו רק 20 תוצאות. כדי לקבל יותר תוצאות, צריך לשלוח כמה בקשות ולהגדיל את הערך של הפרמטר start בכל בקשה. |
הפיכת שאילתות והצגת תוצאות לבינלאומיים
שירות Google WebSearch מאפשר לך לחפש מסמכים בשפות מרובות. ניתן לציין את קידוד התווים שבו יש להשתמש כדי לפרש את בקשת ה-HTTP ולקודד את תגובת ה-XML (באמצעות הפרמטרים ie ו-oe). ניתן גם לסנן את התוצאות כך שיכללו רק מסמכים שנכתבו בשפות מסוימות.
בקטעים הבאים נדון בבעיות שקשורות לחיפוש בכמה שפות:
קידוד תווים
שרתים שולחים נתונים, כמו דפי אינטרנט, לסוכני משתמש, כמו דפדפנים, בתור רצף של בייטים מקודדים. סוכן המשתמש מפענח את הבייטים לרצף של תווים. כששולחים בקשות לשירות WebSearch, אפשר לציין את סכמות הקידוד גם לשאילתת החיפוש וגם לתגובת ה-XML שמקבלים.
אפשר להשתמש בפרמטר הבקשה ie כדי לציין את מנגנון הקידוד של התווים בבקשת ה-HTTP. אפשר גם להשתמש בפרמטר oe כדי לציין את סכמת הקידוד שבה Google צריכה להשתמש כדי לקודד את תגובת ה-XML. אם משתמשים
בסכמת קידוד שאינה ISO-8859-1
(או latin1
), חשוב לוודא שאתם מציינים את הערכים הנכונים לפרמטרים ie ו-oe.
הערה: אם אתם מספקים פונקציונליות חיפוש לכמה שפות, אנחנו ממליצים להשתמש בערך הקידוד utf8
(UTF-8) גם לפרמטר ie וגם לפרמטר oe.
כדי לקבל רשימה מלאה של הערכים שאפשר להשתמש בהם עבור הפרמטרים ie ו-oe, אפשר לעיין בנספח סכימות קידוד תווים.
למידע כללי נוסף על קידוד תווים, אפשר לעיין בכתובת http://www.w3.org/TR/REC-html40/charset.html.
שפות ממשק
אפשר להשתמש בפרמטר הבקשה hl כדי לזהות את שפת הממשק הגרפי. ערך הפרמטר hl עשוי להשפיע על תוצאות חיפוש ב-XML, בייחוד בשאילתות בינלאומיות כשהגבלת השפה (באמצעות הפרמטר lr) לא מצוינת באופן מפורש. במקרים כאלה, הפרמטר hl עשוי לקדם תוצאות חיפוש באותה שפה כמו שפת הקלט של המשתמש.
אנחנו ממליצים להגדיר במפורש את הפרמטר hl בתוצאות החיפוש, כדי להבטיח ש-Google תבחר את תוצאות החיפוש האיכותיות ביותר לכל שאילתה.
בקטע שפות ממשק נתמכות מופיעה רשימה מלאה של הערכים החוקיים לפרמטר hl.
חיפוש מסמכים שנכתבו בשפות מסוימות
אפשר להשתמש בפרמטר הבקשה lr כדי להגביל את תוצאות החיפוש למסמכים שנכתבו בשפה מסוימת או בקבוצת שפות מסוימת.
הפרמטר lr תומך באופרטורים בוליאניים כדי לאפשר לציין מספר שפות שרוצים לכלול (או להחריג) מתוצאות החיפוש.
הדוגמאות הבאות מראות איך אפשר להשתמש באופרטורים בוליאניים כדי לבקש מסמכים בשפות שונות.
למסמכים שנכתבו ביפנית:
lr=lang_jp
למסמכים שנכתבו באיטלקית או בגרמנית:
lr=lang_it|lang_de
עבור מסמכים שאינם כתובים בהונגרית או בצ'כית:
lr=(-lang_hu).(-lang_cs)
בקטע ערכי אוסף שפות מוצגת רשימה מלאה של ערכים אפשריים לפרמטר lr ובקטע אופרטורים בוליאניים לדיון מלא לגבי השימוש באופרטורים האלה.
חיפוש בסינית פשוטה ומסורתית
סינית פשוטה וסינית מסורתית הן שתי גרסאות לכתיבה של השפה הסינית. יכול להיות שאותו קונספט ייכתב בצורה שונה בכל וריאציה. בהינתן שאילתה באחת מהווריאציות, שירות Google WebSearch יכול להחזיר תוצאות שכוללות דפים בשתי הגרסאות.
כדי להשתמש בתכונה הזו:
- מגדירים את פרמטר הבקשה c2coff ל-0
ו- - מבצעים את אחת מהפעולות האלה:
בדוגמה הבאה מוצגים הפרמטרים של השאילתה שצריך לכלול בבקשה לקבלת תוצאות בסינית פשוטה וגם בסינית מסורתית. (לתשומת ליבכם: בדוגמה הזו לא נכלל מידע נדרש נוסף, כמו הלקוח).
search?hl=zh-CN &lr=lang_zh-TW|lang_zh-CN &c2coff=0
סינון התוצאות
Google WebSearch מספק מספר דרכים לסינון תוצאות החיפוש:
סינון אוטומטי של תוצאות החיפוש
במסגרת המאמצים שלנו לספק את תוצאות החיפוש המתאימות ביותר, Google משתמשת בשתי שיטות לסינון אוטומטי של תוצאות חיפוש שנחשבות באופן כללי כבלתי רצויות:
-
תוכן כפול – אם יש כמה מסמכים שהמידע שבהם זהה, רק המסמך הרלוונטי ביותר באותה קבוצה ייכלל בתוצאות החיפוש.
-
עומס ממארח – אם יש הרבה תוצאות חיפוש מאותו אתר, יכול להיות ש-Google לא תציג את כל התוצאות מאותו אתר, או שהתוצאות שיתקבלו יהיו נמוכות יותר מהדירוג שלהן
.
מומלץ להשאיר את המסננים האלה מופעלים לבקשות חיפוש אופייניות מכיוון שהמסננים משפרים משמעותית את האיכות של רוב תוצאות החיפוש. עם זאת, אפשר לעקוף את המסננים האוטומטיים האלה על ידי הגדרת הערך של פרמטר השאילתה filter ל-0 בבקשת החיפוש.
סינון לפי שפה ומדינה
שירות Google WebSearch מחזיר תוצאות מאינדקס ראשי של כל מסמכי האינטרנט. האינדקס הראשי מכיל אוספי משנה של מסמכים שמקובצים לפי מאפיינים מסוימים, כולל שפה ומדינת המוצא.
ניתן להשתמש בפרמטרים של הבקשה lr ו-cr כדי להגביל את תוצאות החיפוש לאוספי משנה של מסמכים שנכתבו בשפות מסוימות או שמקורם במדינות מסוימות, בהתאמה.
מערכת Google WebSearch קובעת את השפה של מסמך באמצעות ניתוח של:
- הדומיין ברמה העליונה (TLD) של כתובת ה-URL של המסמך
- מטא תגים של שפה בתוך המסמך
- השפה הראשית שבה כתוב הטקסט במסמך
עיינו גם בהגדרה של הפרמטר lr, בקטע חיפוש מסמכים שנכתבו בשפות ספציפיות ובערכי איסוף שפות שבהם אפשר להשתמש כערכים בפרמטר lr כדי לקבל מידע נוסף על הגבלת התוצאות על סמך שפה.
המערכת של Google WebSearch קובעת את המדינה של מסמך באמצעות ניתוח של:
- הדומיין ברמה העליונה (TLD) של כתובת ה-URL של המסמך
- המיקום הגיאוגרפי של כתובת ה-IP של שרת האינטרנט
למידע נוסף על הגבלת תוצאות לפי מדינת המוצא, אפשר לעיין גם בהגדרה של הפרמטר cr וב-Country במספר ערכים שיכולים לשמש כערכים של הפרמטר cr.
הערה: אפשר לשלב ערכים של שפה וערכי מדינות כדי להתאים אישית את תוצאות החיפוש. לדוגמה, אפשר לבקש מסמכים שנכתבו בצרפתית ומגיעים מצרפת או מקנדה, או לבקש מסמכים שמגיעים מהולנד ולא כתובים באנגלית. הפרמטרים lr ו-cr תומכים שניהם באופרטורים בוליאניים.
סינון תוכן למבוגרים בלבד באמצעות החיפוש הבטוח
לקוחות רבים של Google לא רוצים להציג תוצאות חיפוש של אתרים שמכילים תוכן למבוגרים בלבד. באמצעות מסנן החיפוש הבטוח שלנו ניתן לסנן תוצאות חיפוש שמכילות תוכן למבוגרים בלבד ולהסיר אותן. המסננים של Google משתמשים בטכנולוגיה קניינית כדי לבדוק מילות מפתח, ביטויים וכתובות אתרים. אמנם אין מסננים מדויקים ב-100 אחוז, אבל החיפוש הבטוח יסיר את רוב התוכן למבוגרים בלבד מתוצאות החיפוש שלך.
Google שואפת לשמור על 'חיפוש בטוח' עדכני ומקיף ככל האפשר, באמצעות סריקה רציפה של האינטרנט ושילוב עדכונים מהצעות המשתמשים.
תכונת החיפוש הבטוח זמינה בשפות הבאות:
הולנדית אנגלית צרפתית גרמנית |
איטלקית פורטוגזית (ברזילאית) ספרדית סינית מסורתית |
ניתן לשנות את המידה שבה Google מסננת את התוצאות שלך להצגת תוכן למבוגרים בלבד באמצעות פרמטר השאילתה safe. הטבלה הבאה מסבירה את הגדרות החיפוש הבטוח של Google וכיצד הגדרות אלה ישפיעו על תוצאות החיפוש שלך:
רמת החיפוש הבטוח | תיאור |
---|---|
גבוה | הפעלת גרסה מחמירה יותר של חיפוש בטוח. |
medium | חסימת דפי אינטרנט שמכילים פורנוגרפיה ותוכן מיני בוטה אחר. |
מושבתת | לא מתבצע סינון של תוכן למבוגרים בלבד מתוצאות החיפוש. |
* הגדרת ברירת המחדל של החיפוש הבטוח מושבתת.
אם החיפוש הבטוח מופעל ובתוצאות מוצאים אתרים שמכילים תוכן פוגעני, יש לשלוח אימייל אל כתובת ה-URL של האתר לכתובת safesearch@google.com, ואנחנו נבדוק את האתר.
תוצאות XML
- DTD של תוצאות Google XML
- מידע על תגובת XML
- תוצאות XML לשאילתות חיפוש רגילות ומתקדם
- חיפוש רגיל/מתקדם: שאילתה לדוגמה ותוצאת XML
- חיפוש רגיל/מתקדם: תגי XML
DTD של תוצאות Google XML
Google משתמשת באותו DTD כדי לתאר את פורמט ה-XML עבור כל הסוגים של תוצאות החיפוש. רבים מהתגים ומהמאפיינים חלים על כל סוגי החיפוש. עם זאת, חלק מהתגים חלים רק על סוגי חיפוש מסוימים. כתוצאה מכך, ההגדרות ב-DTD עשויות להיות פחות מגבילות מההגדרות שנקבעו במסמך הזה.
במסמך הזה מתוארים ההיבטים של DTD שרלוונטיים ל-WebSearch. כשמסתכלים על ה-DTD, אם עובדים על WebSearch, אפשר להתעלם בבטחה מתגים וממאפיינים שלא תועדו כאן. אם ההגדרה שונה בין DTD לבין התיעוד, עובדה זו מצוינת במסמך זה.
Google יכולה להחזיר תוצאות XML עם או בלי הפניה ל-DTD האחרון. ה-DTD הוא מדריך שעוזר למנהלי חיפוש ולמנתחי XML להבין את תוצאות ה-XML של Google. בגלל שדקדוק ה-XML של Google עשוי להשתנות מעת לעת, אין להגדיר את המנתח להשתמש ב-DTD כדי לאמת כל תוצאת XML.
בנוסף, אין להגדיר את מנתח ה-XML כך שיאחזר את ה-DTD בכל פעם ששולחים בקשת חיפוש. Google מעדכנת את ה-DTD לעתים רחוקות, והבקשות האלה גורמות לעיכובים מיותרים ולדרישות מיותרות של רוחב פס.
כדי לקבל תוצאות XML, Google ממליצה להשתמש בפורמט הפלט xml_no_dtd. אם מציינים את הפורמט xml output בבקשת החיפוש, ההבדל היחיד הוא הכללת השורה הבאה בתוצאות ה-XML:
<!DOCTYPE GSP SYSTEM "google.dtd">
ניתן לגשת ל-DTD העדכני ביותר בכתובת http://www.google.com/google.dtd.
לתשומת ליבכם: ייתכן שלא כל התכונות ב-DTD יהיו זמינות או נתמכות בשלב זה.
מידע על תגובת ה-XML
- כל ערכי הרכיבים הם HTML חוקי ומתאים להצגה, אלא אם צוין אחרת בהגדרות של תגי ה-XML.
- חלק מערכי הרכיבים הם כתובות URL שצריך להיות מקודד ב-HTML לפני שהם מוצגים.
- מנתח ה-XML צריך להתעלם ממאפיינים ומתגים שאינם מתועדים. כך האפליקציה תמשיך לפעול ללא שינויים אם Google מוסיפה תכונות לפלט ה-XML.
- יש תווים מסוימים שצריך לסמן אותם בתו בריחה (escape) כשהם כוללים אותם כערכים בתגי XML. מעבד ה-XML צריך להמיר את הישויות האלה
לתווים המתאימים. לדוגמה, אם לא תתבצע המרה תקינה של ישויות,
הדפדפן עשוי לעבד את התו & כ-"&".
תקן XML מתעד את התווים האלה,
והתווים האלה
מופיעים בטבלה הבאה:
דמות טפסים שהוחמיצו ישות קוד תו סימן 'גם' (אמפרסנד) ו- & & גרש ' ' ' מירכאות כפולות " " " גדול מ- > > > קטן מ- < < <
תוצאות XML לשאילתות חיפוש רגילות ומתקדם
חיפוש רגיל/מתקדם: שאילתה לדוגמה ותוצאת XML
הבקשה לדוגמה הזו ב-WebSearch מבקשת 10 תוצאות (num=10
)
לגבי מונח החיפוש "socer" (q=socer
), שהוא המילה
"soccer" באיות שגוי בדוגמה זו.)
http://www.google.com/search?
q=socer
&hl=en
&start=10
&num=10
&output=xml
&client=google-csbe
&cx=00255077836266642015:u-scht7a-8i
הבקשה הזו מניבה את תוצאת ה-XML הבאה. שימו לב שיש מספר הערות בתוצאת ה-XML שמציינות היכן יופיעו תגים מסוימים שאינם נכללים בתוצאה.
<?xml version="1.0" encoding="ISO-8859-1" standalone="no" ?>
<GSP VER="3.2">
<TM>0.452923</TM>
<Q>socer</Q>
<PARAM name="cx" value="00255077836266642015:u-scht7a-8i" original_value="00255077836266642015%3Au-scht7a-8i"/>
<PARAM name="hl" value="en" original_value="en"/>
<PARAM name="q" value="socer" original_value="socer"/>
<PARAM name="output" value="xml" original_value="xml"/>
<PARAM name="client" value="google-csbe" original_value="google-csbe"/>
<PARAM name="num" value="10" original_value="10"/>
<Spelling>
<Suggestion q="soccer"><b><i>soccer</i></b></Suggestion>
</Spelling>
<Context>
<title>Sample Vacation CSE</title>
<Facet>
<FacetItem>
<label>restaurants</label>
<anchor_text>restaurants</anchor_text>
</FacetItem>
<FacetItem>
<label>wineries</label>
<anchor_text>wineries</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>golf_courses</label>
<anchor_text>golf courses</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>hotels</label>
<anchor_text>hotels</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>nightlife</label>
<anchor_text>nightlife</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>soccer_sites</label>
<anchor_text>soccer sites</anchor_text>
</FacetItem>
</Facet>
</Context>
<RES SN="1" EN="10">
<M>6080</M>
/*
* The FI tag after the comment indicates that the result
* set has been filtered. If the number of results were exact, the
* FI tag would be replaced by an XT tag in the same format.
*/
<FI />
<NB>
/*
* Since the request is for the first page of results, the PU tag,
* which contains a link to the previous page of search results,
* is not included in this XML result. If the sample result did include
* a previous page of results, it would be listed here, in the same format
* as the NU tag on the following line
*/
<NU>/search?q=socer&hl=en&lr=&ie=UTF-8&output=xml&client=test&start=10&sa=N</NU>
</NB>
<R N="1">
<U>http://www.soccerconnection.net/</U>
<UE>http://www.soccerconnection.net/</UE>
<T>SoccerConnection.net</T>
<CRAWLDATE>May 21, 2007</CRAWLDATE>
<S><b>soccer</b>; players; coaches; ball; world cup;<b>...</b></S>
<Label>transcodable_pages</Label>
<Label>accessible</Label>
<Label>soccer_sites</Label>
<LANG>en</LANG>
<HAS>
<DI>
<DT>SoccerConnection.net</DT>
<DS>Post your <b>soccer</b> resume directly on the Internet.</DS>
</DI>
<L/>
<C SZ="8k" CID="kWAPoYw1xIUJ"/>
<RT/>
</HAS>
</R>
/*
* The result includes nine more results, each enclosed by an R tag.
*/
</RES>
</GSP>
חיפוש רגיל/מתקדם: תגי XML
תגובות XML לבקשות חיפוש רגילות ובקשות לחיפוש מתקדם משתמשות באותה קבוצה של תגי XML. תגי ה-XML האלה מוצגים בדוגמה של ה-XML שלמעלה, ומפורטים בטבלאות שבהמשך.
תגי ה-XML הבאים מפורטים בסדר אלפביתי לפי שם התג, וכל הגדרת תג כוללת תיאור של התג. דוגמה שמראה איך התג ייראה בתוצאת XML ואת הפורמט של תוכן התג. אם התג הוא תג משנה של תג XML אחר, או אם יש לתג תגי משנה או מאפיינים משלו, המידע הזה מסופק גם בטבלת ההגדרות של התג.
ייתכן שסמלים מסוימים יוצגו לצד תגי משנה בהגדרות שלמטה. לפניכם פירוט של הסמלים והמשמעויות שלהם:
* = אפס מופעים או יותר של תג המשנה
+ = מופע אחד או יותר של תג המשנה
א | B | C | G | א | ל | נ | צ | ש | R | T | U | X |
anchor_text | |
---|---|
הגדרה | התג <anchor_text> מציין את הטקסט שצריך להציג למשתמשים כדי לזהות תווית חידוד שמשויכת לקבוצת תוצאות חיפוש. תוויות החידוד מחליפות תווים שאינם אלפאנומריים בקווים תחתונים, ולכן אין להציג את הערך של התג <label> בממשק המשתמש. במקום זאת, צריך להציג את הערך של התג <anchor_text>. |
דוגמה | <anchor_text>מסלולי גולף</anchor_text> |
תג משנה של | FacetItem |
פורמט התוכן | טקסט |
חסימה | |
---|---|
הגדרה | התג הזה כולל את התוכן של בלוק בשורה גוף של תוצאת קידום. לכל בלוק יש את תגי המשנה T, U ו-L. תג T שאינו ריק מציין שהבלוק מכיל טקסט; תגי U ו-L שאינם ריקים מציינים שהבלוק מכיל קישור (כאשר כתובת ה-URL מצוינת בתג המשנה U, וטקסט העוגן בתג המשנה L). |
תגי משנה | T, U, L |
תג משנה של | BODY_LINE |
פורמט התוכן | ריק |
BODY_LINE | |
---|---|
הגדרה | תג זה כולל את התוכן של שורה בגוף התוצאה המקודמת. כל שורת גוף כוללת כמה תגי BLOCK, שמכילים טקסט או קישור עם כתובת URL וטקסט עוגן. |
תגי משנה | חסימה* |
תג משנה של | SL_MAIN |
פורמט התוכן | ריק |
C | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|
הגדרה | התג <C> מציין ששירות WebSearch יכול לאחזר גרסה שנשמרה במטמון של כתובת ה-URL של תוצאת החיפוש הזו. לא ניתן
לאחזר דפים שנשמרו במטמון דרך XML API, אבל אפשר להפנות את המשתמשים
לכתובת www.google.com
של התוכן הזה. |
|||||||||
מאפיינים |
|
|||||||||
דוגמה | <C SZ="6k" CID="kvOXK_cYSSgJ" /> | |||||||||
תג משנה של | HAS | |||||||||
פורמט התוכן | ריק |
C2C | |
---|---|
הגדרה | התג <C2C> מציין שהתוצאה מתייחסת לדף בשפה הסינית מסורתית. התג הזה מופיע רק כאשר מופעל חיפוש בסינית פשוטה ומסורתית. מידע נוסף על הפעלה והשבתה של התכונה הזו זמין בהגדרת פרמטר השאילתה c2coff. |
פורמט התוכן | טקסט |
הקשר | |
---|---|
הגדרה | התג <Context> כולל רשימה של תוויות חידוד שמשויכות לקבוצה של תוצאות חיפוש. |
דוגמה | <Context> |
תגי משנה | title, Facet+ |
פורמט התוכן | מאגר |
תכנון | |
---|---|
הגדרה | התג <CRAWLDATE> מזהה את התאריך
שבו הדף נסרק לאחרונה. הפונקציה |
דוגמה | <CRAWLDATE>21 במאי, 2005</CRAWLDATE> |
תג משנה של | R |
פורמט התוכן | טקסט |
עשה זאת בעצמך | |
---|---|
הגדרה | התג <DI> כולל את פרטי הקטגוריה של Open Directory Project (ODP) של תוצאת חיפוש אחת. |
דוגמה | <DI> |
תגי משנה | DT?, DS? |
תג משנה של | HAS |
פורמט התוכן | ריק |
DS | |
---|---|
הגדרה | התג <DS> מספק את הסיכום המפורט של קטגוריה אחת בספריית ה-ODP. |
דוגמה | <DS>פרסום של קורות החיים שלך <b>soccer</b> ישירות באינטרנט.</DS> |
תג משנה של | DI |
פורמט התוכן | טקסט (עשוי להכיל HTML) |
DT | |
---|---|
הגדרה | התג <DT> מספק את הכותרת של קטגוריה יחידה שרשומה בספריית ODP. |
דוגמה | <DT>כדורגלConnection.net</DT> |
תג משנה של | DI |
פורמט התוכן | טקסט (עשוי להכיל HTML) |
מאפיין | |
---|---|
הגדרה | התג <Facet> מכיל קיבוץ לוגי של תגי <FacetItem>. אפשר ליצור את הקבוצות האלה באמצעות פורמט מפרט XML של Programmable Search Engine. אם לא יוצרים את הקבוצות האלה, התג results_xml_tag_Context><Context> מכיל עד ארבעה תגי <Facet>. הפריטים בכל תג <Facet> יקובצו למטרות תצוגה, אבל יכול להיות שלא יהיה להם קשר לוגי. |
דוגמה | <Facet> |
תגי משנה | FacetItem+, title+ |
תג משנה של | הֶקשר |
פורמט התוכן | מאגר |
FacetItem | |
---|---|
הגדרה | התג <FacetItem> כולל מידע על תווית חידוד המשויכת לקבוצת תוצאות חיפוש. |
דוגמה | <FacetItem> |
תגי משנה | label, anchor_text+ |
תג משנה של | היבט |
פורמט התוכן | FacetItem |
FI | |
---|---|
הגדרה | התג <FI> משמש כסימון שמציין אם בוצע סינון מסמכים עבור החיפוש. אפשר לקרוא מידע נוסף על המסננים של תוצאות החיפוש של Google בקטע סינון אוטומטי במסמך הזה. |
דוגמה | <FI /> |
תג משנה של | רזולוציה |
פורמט התוכן | ריק |
קידום מודעות ב-Google | |||||||
---|---|---|---|---|---|---|---|
הגדרה | התג <GSP> כולל את כל הנתונים שהוחזרו בתוצאות החיפוש של Google בפורמט XML. "GSP" הוא קיצור של "פרוטוקול חיפוש Google". |
||||||
מאפיינים |
|
||||||
דוגמה | <GSP VER="3.2"> | ||||||
תגי משנה | PARAM+, Q, RES?, סימן מסחרי | ||||||
פורמט התוכן | ריק |
HAS | |
---|---|
הגדרה | התג <HAS> כולל מידע על כל פרמטרים מיוחדים של בקשת חיפוש שנתמכים בכתובת אתר מסוימת.
הערה: ההגדרה של <HAS> עבור WebSearch מגבילה יותר מאשר ב-DTD. |
תגי משנה | DI?, L?, C?, RT? |
תג משנה של | R |
כתובת ISURL | |
---|---|
הגדרה | Google מחזירה את התג <ISURL> אם שאילתת החיפוש המשויכת היא כתובת URL. |
תג משנה של | GSP |
פורמט התוכן | ריק |
L | |
---|---|
הגדרה | נוכחות התג <L> מציינת ששירות WebSearch יכול למצוא אתרים אחרים שמקשרים לכתובת האתר הזו של תוצאת החיפוש. כדי למצוא אתרים כאלה, אפשר להשתמש במונח השאילתה המיוחד link:. |
תג משנה של | HAS |
פורמט התוכן | ריק |
label | |
---|---|
הגדרה | התג <label> מציין תווית חידוד שדרכה אפשר להשתמש כדי לסנן את תוצאות החיפוש שיתקבלו. כדי להשתמש בתווית חידוד, צריך להוסיף את המחרוזת עוד:[[label tag value]] לערך של הפרמטר q בבקשת ה-HTTP אל Google, כפי שמוצג בדוגמה הבאה. חשוב לשים לב שצריך לסמן את הערך הזה בתו בריחה (escape) של כתובת ה-URL לפני שליחת השאילתה ל-Google. This example uses the refinement label golf_courses to הערה: התג <label> שונה מהתג <Label>, שמזהה תווית חידוד המשויכת לכתובת אתר מסוימת בתוצאות החיפוש שלך. |
דוגמה | <label>golf_courses</label> |
תג משנה של | FacetItem |
פורמט התוכן | טקסט |
שפה | |
---|---|
הגדרה | התג <LANG> מכיל את הניחוש הטוב ביותר של Google לגבי השפה של תוצאת החיפוש. |
דוגמה | <LANG>en</LANG> |
תג משנה של | R |
פורמט התוכן | טקסט |
M | |
---|---|
הגדרה | התג <M> מזהה את המספר הכולל המשוער של תוצאות החיפוש. הערה: יכול להיות שהאומדן הזה לא מדויק. |
דוגמה | <M>16200000</M> |
תג משנה של | רזולוציה |
פורמט התוכן | טקסט |
NB | |
---|---|
הגדרה | התג <NB> כולל את פרטי הניווט של קבוצת התוצאות, כלומר קישורים לדף הבא של תוצאות החיפוש או לדף הקודם של תוצאות החיפוש. הערה: התג הזה קיים רק אם יש תוצאות נוספות. |
דוגמה | <NB> |
תגי משנה | NU?, PU? |
תג משנה של | רזולוציה |
פורמט התוכן | ריק |
נוב' | |
---|---|
הגדרה | התג <NU> מכיל קישור יחסי לדף הבא של תוצאות החיפוש. |
דוגמה | <NU>/search?q=flowers&num=10&hl=iw&ie=UTF-8 &output=xml&client=test&start=10</NU> |
תג משנה של | NB |
פורמט התוכן | טקסט (כתובת URL יחסית) |
פרמטר | |||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
הגדרה | התג <PARAM> מזהה פרמטר קלט שנשלח בבקשת ה-HTTP המשויכת לתוצאת ה-XML. מידע על הפרמטר נכלל במאפייני התג — שם, ערך, מקורי_value — ויתקבל תג PARAM אחד לכל פרמטר שנשלח בבקשת ה-HTTP. |
||||||||||||
מאפיינים |
|
||||||||||||
דוגמה | <PARAM name="cr" value="countryNZ" source_value="countryNZ" /> | ||||||||||||
תג משנה של | GSP | ||||||||||||
פורמט התוכן | רמה למתקדמים מאוד |
יחידת קיבולת (PU) | |
---|---|
הגדרה | התג <PU> מספק קישור יחסי לדף הקודם של תוצאות החיפוש. |
דוגמה | <PU>/search?q=flowers&num=10&hl=iw&output=xml &client=test&start=10</PU> |
תג משנה של | NB |
פורמט התוכן | טקסט (כתובת URL יחסית) |
Q | |
---|---|
הגדרה | התג <Q> מזהה את שאילתת החיפוש שנשלחה בבקשת ה-HTTP שמשויכת לתוצאת ה-XML. |
דוגמה | <Q>pizza</Q> |
תג משנה של | GSP |
פורמט התוכן | טקסט |
R | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|
הגדרה | התג <R> כולל את הפרטים של תוצאת חיפוש בודדת. הערה: ההגדרה של התג <R> ב-WebSearch מגבילה יותר מאשר ב-DTD. |
|||||||||
מאפיינים |
|
|||||||||
תגי משנה | U, UE, T?, CRAWLDATE, S?, lang?, HAS | |||||||||
תג משנה של | רזולוציה |
מחדש | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|
הגדרה | התג <RES> כולל את הקבוצה של תוצאות החיפוש הנפרדות ואת הפרטים על התוצאות האלה. |
|||||||||
מאפיינים |
|
|||||||||
דוגמה | <RES SN="1" EN="10"> | |||||||||
תגי משנה | M, FI?, XT?, NB?, R* | |||||||||
תג משנה של | GSP | |||||||||
פורמט התוכן | ריק |
S | |
---|---|
הגדרה | התג <S> מכיל קטע מתוך תוצאת חיפוש, שמונחי השאילתה מודגשים. מעברי שורה נכללים בקטע כדי לאפשר גלישת טקסט תקינה. |
דוגמה | <S>וושינגטון (CNN) -- הצעת מחיר לסיום העימות בסנאט מול הנשיא <b>Bush's</b> הבחירות המשפטיות תאפשר לחמישה מועמדים להתקדם להצבעה סופית תוך שימור <b>...<b>...</b> |
תג משנה של | R |
פורמט התוכן | טקסט (HTML) |
SL_MAIN | |
---|---|
הגדרה | תג זה כולל את התוכן של תוצאת קידום מכירות. משמש לניתוח מבצעים. טקסט העוגן וכתובת ה-URL של קישור הכותרת נכללים בתגי המשנה T ו-U, בהתאמה. השורות והקישורים בגוף הטקסט כלולים בתגי משנה של BODY_LINE. |
תגי משנה | BODY_LINE*, T, U |
תג משנה של | SL_RESULTS |
פורמט התוכן | ריק |
SL_RESULTS | |
---|---|
הגדרה | תג מאגר לתוצאות מקודמים. אחד מהסטטוסים האלה יופיע בכל פעם שיופיע קידום מכירות בתוצאות החיפוש שלכם. תג המשנה SL_MAIN מכיל את נתוני התוצאה העיקריים. |
תגי משנה | SL_MAIN* |
תג משנה של | R |
פורמט התוכן | ריק |
איות | |
---|---|
הגדרה | התג <Spelling> כולל הצעת איות חלופית לשאילתה שנשלחה. התג הזה מופיע רק בדף הראשון של תוצאות החיפוש. הצעות איות זמינות באנגלית, בסינית, ביפנית ובקוריאנית. הערה: Google תחזיר הצעות איות רק לשאילתות שבהן ערך הפרמטר gl מופיע באותיות קטנות. |
דוגמה | <Spelling> |
תגי משנה | הצעה |
תג משנה של | GSP |
פורמט התוכן | ריק |
הצעה | |||||||
---|---|---|---|---|---|---|---|
הגדרה | התג <Suggestion> מכיל הצעת איות חלופית לשאילתה שנשלחה. אפשר להשתמש בתוכן התג כדי להציע את האיות החלופי למשתמש בחיפוש. הערך של המאפיין q הוא הצעת האיות עם קוד Escape בכתובת URL, שאפשר להשתמש בה כמונח לשאילתה. | ||||||
מאפיינים |
|
||||||
דוגמה | <Suggestion q="soccer"><b><i>soccer</i></b></Suggestion> | ||||||
תג משנה של | איות | ||||||
פורמט התוכן | טקסט (HTML) |
T | |
---|---|
הגדרה | התג <T> מכיל את הכותרת של התוצאה. |
דוגמה | <T>החוף המזרחי של עמיצ'י פיצרייה</T> |
תג משנה של | R |
פורמט התוכן | טקסט (HTML) |
שם פריט | |
---|---|
הגדרה | כצאצא של <Context>, התג <title> מכיל את השם של Programmable Search Engine. כצאצא של <Facet>, התג <title> מספק כותרת לקבוצת מאפיינים. |
דוגמה | כצאצא של <Context>: <title>מנוע החיפוש My Search</title> כצאצא של <Facet>: <title>facet title</title> |
תג משנה של | הקשר, Facet |
פורמט התוכן | טקסט |
TM | |
---|---|
הגדרה | התג <TM> מזהה את הזמן הכולל שנדרש לשרת כדי להחזיר תוצאות חיפוש. הזמן נמדד בשניות. |
דוגמה | <TM>0.100445</TM> |
תג משנה של | GSP |
פורמט התוכן | טקסט (מספר מרחף) |
TT | |
---|---|
הגדרה | התג <TT> מספק טיפ לחיפוש. |
דוגמה | <TT><i>טיפ: ברוב הדפדפנים, הקשה על מקש Return מניבה את אותן התוצאות כמו לחיצה על לחצן החיפוש.</i></TT> |
תג משנה של | GSP |
U | |
---|---|
הגדרה | התג <U> מספק את כתובת ה-URL של תוצאת החיפוש. |
דוגמה | <U>http://www.dominos.com/</U> |
תג משנה של | R |
פורמט התוכן | טקסט (כתובת URL מוחלטת) |
דולר ארה"ב (UD) | |
---|---|
הגדרה | התג <UD> מספק את כתובת ה-URL עם קידוד IDN (שם דומיין בינלאומי) עבור תוצאת החיפוש. הערך מאפשר להציג דומיינים בשפות מקומיות. לדוגמה, אפשר לפענח את כתובת ה-URL בקידוד IDN http://www.%E8%8A%B1%E4%BA%95.com ולהציג אותה כך: http://www.花 בקריטריונים鮨.com. התג <UD> יופיע בתוצאות החיפוש רק לבקשות הכוללות את הפרמטר ud. הערה: זוהי תכונת בטא. |
דוגמה | <UD>http://www.%E8%8A%B1%E4%BA%95.com/</UD> |
תג משנה של | R |
פורמט התוכן | טקסט (כתובת URL בקידוד IDN) |
UE | |
---|---|
הגדרה | התג <UE> מספק את כתובת ה-URL של תוצאת החיפוש. הערך מסומן בתו בריחה (escape) של כתובת URL כך שהוא יתאים להעברה כפרמטר של שאילתה בכתובת URL. |
דוגמה | <UE>http://www.dominos.com/</UE> |
תג משנה של | R |
פורמט התוכן | טקסט (כתובת URL עם תו בריחה (escape)) |
XT | |
---|---|
הגדרה | התג <XT> מציין שהמספר הכולל המשוער של התוצאות, כפי שצוין בתג M, מייצג למעשה את המספר הכולל המדויק של התוצאות. אפשר לקרוא פרטים נוספים בקטע Automatic Filter במסמך הזה. |
דוגמה | <XT /> |
תג משנה של | רזולוציה |
פורמט התוכן | ריק |
תוצאות XML לשאילתות חיפוש תמונות
בקשת התמונה לדוגמה הזו מבקשת 5 תוצאות (num=5) לגבי מונח החיפוש 'קוף' (q=קוף).
http://www.google.com/cse? searchtype=image &num=2 &q=monkey &client=google-csbe &output=xml_no_dtd &cx=00255077836266642015:u-scht7a-8i
הבקשה הזו מניבה את תוצאת ה-XML הבאה.
<GSP VER="3.2"> <TM>0.395037</TM> <Q>monkeys</Q> <PARAM name="cx" value="011737558837375720776:mbfrjmyam1g" original_value="011737558837375720776:mbfrjmyam1g" url_<escaped_value="011737558837375720776%3Ambfrjmyam1g" js_escaped_value="011737558837375720776:mbfrjmyam1g"/> <PARAM name="client" value="google-csbe" original_value="google-csbe" url_escaped_value="google-csbe" js_escaped_value="google-csbe"/> <PARAM name="q" value="monkeys" original_value="monkeys" url_escaped_value="monkeys" js_escaped_value="monkeys"/> <PARAM name="num" value="2" original_value="2" url_escaped_value="2" js_escaped_value="2"/> <PARAM name="output" value="xml_no_dtd" original_value="xml_no_dtd" url_escaped_value="xml_no_dtd" js_escaped_value="xml_no_dtd"/> <PARAM name="adkw" value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" original_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" url_escaped_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" js_escaped_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A"/> <PARAM name="hl" value="en" original_value="en" url_escaped_value="en" js_escaped_value="en"/> <PARAM name="oe" value="UTF-8" original_value="UTF-8" url_escaped_value="UTF-8" js_escaped_value="UTF-8"/> <PARAM name="ie" value="UTF-8" original_value="UTF-8" url_escaped_value="UTF-8" js_escaped_value="UTF-8"/> <PARAM name="boostcse" value="0" original_value="0" url_escaped_value="0" js_escaped_value="0"/> <Context> <title>domestigeek</title> </Context> <ARES/> <RES SN="1" EN="2"> <M>2500000</M> <NB> <NU>/images?q=monkeys&num=2&hl=en&client=google-csbe&cx=011737558837375720776:mbfrjmyam1g&boostcse=0&output=xml_no_dtd &ie=UTF-8&oe=UTF-8&tbm=isch&ei=786oTsLiJaaFiALKrPChBg&start=2&sa=N </NU> </NB> <RG START="1" SIZE="2"/> <R N="1" MIME="image/jpeg"> <RU>http://www.flickr.com/photos/fncll/135465558/</RU> <U> http://farm1.static.flickr.com/46/135465558_123402af8c.jpg </U> <UE> http://farm1.static.flickr.com/46/135465558_123402af8c.jpg </UE> <T>Computer <b>Monkeys</b> | Flickr - Photo Sharing!</T> <RK>0</RK> <BYLINEDATE>1146034800</BYLINEDATE> <S>Computer <b>Monkeys</b> | Flickr</S> <LANG>en</LANG> <IMG WH="500" HT="305" IID="ANd9GcQARKLwzi-t4lpWi2AERV3kJb4ansaQzTn3MNDZR9fD_JDiktPKByKUBLs"> <SZ>88386</SZ> <IN/> </IMG> <TBN TYPE="0" WH="130" HT="79" URL="http://t0.gstatic.com/images?q=tbn:ANd9GcQARKLwzi- t4lpWi2AERV3kJb4ansaQzTn3MNDZR9fD_JDiktPKByKUBLs"/> </R> <R N="2" MIME="image/jpeg"> <RU> http://www.flickr.com/photos/flickerbulb/187044366/ </RU> <U> http://farm1.static.flickr.com/73/187044366_506a1933f4.jpg </U> <UE> http://farm1.static.flickr.com/73/187044366_506a1933f4.jpg </UE> <T> one. ugly. <b>monkey</b>. | Flickr - Photo Sharing! </T> <RK>0</RK> <BYLINEDATE>1152514800</BYLINEDATE> <S>one. ugly. <b>monkey</b>.</S> <LANG>en</LANG> <IMG WH="400" HT="481" IID="ANd9GcQ3Qom0bYbee4fThCQVi96jMEwMU6IvVf2b8K5vERKVw- EF4tQQnDDKOq0"><SZ>58339</SZ> <IN/> </IMG> <TBN TYPE="0" WH="107" HT="129" URL="http://t1.gstatic.com/images?q=tbn:ANd9GcQ3Qom0bYbee4fThCQ Vi96jMEwMU6IvVf2b8K5vERKVw-EF4tQQnDDKOq0"/> </R> </RES> </GSP>
חיפוש תמונות: תגי XML
הטבלה הבאה מציגה תגי XML נוספים שמשמשים בתגובות XML לשאילתות של חיפוש תמונות.
ייתכן שסמלים מסוימים יוצגו לצד תגי משנה בהגדרות שלמטה. לפניכם פירוט של הסמלים והמשמעויות שלהם:
* = אפס מופעים או יותר של תג המשנה
+ = מופע אחד או יותר של תג המשנה
RG | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|
הגדרה | התג <RG> תוחם את הפרטים של תוצאת חיפוש של תמונה בודדת. |
|||||||||
מאפיינים |
| |||||||||
תג משנה של | רזולוציה |
RU | |
---|---|
הגדרה | התג <RU tag> כולל את הפרטים של כל תוצאת חיפוש של תמונה. |
תג משנה של | R |