בדף הזה מוסבר על גרסת ה-XML של Custom Search API בפורמט JSON, שזמינה רק ללקוחות של Google חיפוש באתר.
- סקירה כללית
- פורמט הבקשה של Programmable Search Engine
- תוצאות XML
סקירה כללית
שירות Google WebSearch מאפשר ללקוחות של Google Site Search להציג תוצאות חיפוש של Google באתרים שלהם. שירות WebSearch משתמש בפרוטוקול פשוט מבוסס-HTTP כדי להציג תוצאות חיפוש. לאדמינים של החיפוש יש שליטה מלאה באופן שבו הם מבקשים תוצאות חיפוש ובאופן שבו הם מציגים את התוצאות האלה למשתמש הקצה. במסמך הזה מפורטים הפרטים הטכניים של פורמטים של בקשות ושל תוצאות חיפוש ב-Google.
כדי לאחזר תוצאות של חיפוש אינטרנט ב-Google, האפליקציה שולחת ל-Google בקשת HTTP פשוטה. לאחר מכן Google מחזירה תוצאות חיפוש בפורמט XML. תוצאות בפורמט XML מאפשרות לכם להתאים אישית את אופן הצגת תוצאות החיפוש.
פורמט הבקשה של חיפוש באינטרנט
- בקשה סקירה כללית
- מונחי השאילתה
- פרמטרים של בקשה
- דוגמאות לשאילתות בחיפוש Google
- WebSearch Query Parameter Definitions
- שאילתות לדוגמה של תמונות
- שאילתת חיפוש תמונות הגדרות הפרמטרים
- חיפוש מתקדם
- חיפוש מתקדם פרמטרים של שאילתה
- תנאים מיוחדים לחיפוש שאילתות
- מגבלות על בקשות
סקירה כללית של הבקשה
בקשת החיפוש ב-Google היא פקודת HTTP GET רגילה. היא כוללת אוסף של פרמטרים שרלוונטיים לשאילתות שלכם. הפרמטרים האלה כלולים בכתובת ה-URL של הבקשה כצמדים של שם=ערך
שמופרדים באמצעות התו אמפרסנד (&). הפרמטרים כוללים נתונים כמו שאילתת החיפוש ומזהה מנוע ייחודי (cx) שמזהה את המנוע ששולח את בקשת ה-HTTP. שירות WebSearch או שירות חיפוש התמונות מחזירים תוצאות ב-XML בתגובה לבקשות HTTP.
מונחי השאילתה
רוב בקשות החיפוש כוללות מונח חיפוש אחד או יותר. מונח שאילתה מופיע כערך של פרמטר בבקשת החיפוש.
מונחי שאילתה יכולים לציין כמה סוגים של מידע כדי לסנן ולארגן את תוצאות החיפוש ש-Google מחזירה. אפשר לציין בשאילתות:
- מילים או ביטויים שרוצים לכלול או להחריג
- כל המילים בשאילתת חיפוש (ברירת מחדל)
- ביטוי מדויק בשאילתת החיפוש
- כל מילה או ביטוי בשאילתת חיפוש
- איפה במסמך לחפש את מונחי החיפוש
- בכל מקום במסמך (ברירת מחדל)
- רק בקישורים במסמך
- הגבלות על המסמכים עצמם
- הכללה או אי-הכללה של מסמכים מסוגי קבצים מסוימים (כמו קובצי PDF או מסמכי Word)
- שאילתות מיוחדות של כתובות URL שמחזירות
מידע על כתובת URL מסוימת, במקום לבצע חיפוש
- שאילתות שמחזירות מידע כללי על כתובת URL, כמו הקטגוריה, התקציר או השפה שלה ב-Open Directory
- שאילתות שמחזירות את קבוצת דפי האינטרנט שמקשרים לכתובת URL
- שאילתות שמחזירות קבוצה של דפי אינטרנט שדומים לכתובת URL נתונה
חיפוש ברירת מחדל
צריך להשתמש ב-URL Escaping כדי להוסיף ערכים לפרמטרים של שאילתות חיפוש. שימו לב: צריך להחליף את סימן הפלוס (+) בכל רצף של רווחים בשאילתת החיפוש. מידע נוסף מופיע בקטע URL Escaping במאמר הזה.
מונח החיפוש נשלח לשירות WebSearch באמצעות הפרמטר q. A דוגמה למונח בשאילתת חיפוש:
q=horses+cows+pigs
כברירת מחדל, שירות Google WebSearch מחזיר רק מסמכים שכוללים את כל המונחים בשאילתת החיפוש.
פרמטרים של בקשות
בקטע הזה מפורטים הפרמטרים שאפשר להשתמש בהם כששולחים בקשת חיפוש. הפרמטרים מחולקים לשתי רשימות. הרשימה הראשונה מכילה פרמטרים שרלוונטיים לכל בקשות החיפוש. הרשימה השנייה מכילה פרמטרים שרלוונטיים רק לבקשות חיפוש מתקדם.
יש שלושה פרמטרים שחובה לציין בבקשה:
- הפרמטר client צריך להיות מוגדר לערך
google-csbe - הפרמטר output מציין את הפורמט של תוצאות ה-XML שמוחזרות. אפשר להחזיר את התוצאות עם (xml) או בלי (
xml_no_dtd) הפניה ל-DTD של Google. מומלץ להגדיר את הערך הזה ל-xml_no_dtd. הערה: אם לא מציינים את הפרמטר הזה, התוצאות יוחזרו ב-HTML במקום ב-XML.
- הפרמטר cx שמייצג את המזהה הייחודי של המנוע.
פרמטרים נפוצים אחרים של בקשות, שלא צוינו למעלה:
דוגמאות לשאילתות בחיפוש באינטרנט
בדוגמאות הבאות מוצגות כמה בקשות HTTP של WebSearch כדי להמחיש את השימוש בפרמטרים שונים של שאילתות. הגדרות של הפרמטרים השונים של השאילתה מפורטות בקטעים הגדרות של פרמטרים של שאילתת חיפוש באינטרנט ופרמטרים של שאילתת חיפוש מתקדם במסמך הזה.
בדוגמה הזו, הבקשה היא לקבל את 10 התוצאות הראשונות (start=0&num=10) של מונח החיפוש 'red sox' (q=red+sox). בנוסף, בבקשה מצוין שהתוצאות צריכות להגיע מאתרים קנדיים (cr=countryCA) ולהיות כתובות בצרפתית (lr=lang_fr). לבסוף, בבקשה מצוינים ערכים לפרמטרים client, output ו-cx, שכולם נדרשים.
http://www.google.com/search?
start=0
&num=10
&q=red+sox
&cr=countryCA
&lr=lang_fr
&client=google-csbe
&output=xml_no_dtd
&cx=00255077836266642015:u-scht7a-8i
בדוגמה הזו נעשה שימוש בחלק מפרמטרים של שאילתת חיפוש מתקדם כדי להתאים אישית עוד יותר את שאילתת החיפוש. בבקשה הזו נעשה שימוש בפרמטר as_q (as_q=red+sox) במקום בפרמטר q. היא גם משתמשת בפרמטר as_eq כדי להחריג מתוצאות החיפוש מסמכים שמכילים את המילה Yankees (as_eq=yankees).
http://www.google.com/search?
start=0
&num=10
&as_q=red+sox
&as_eq=Yankees
&client=google-csbe
&output=xml_no_dtd
&cx=00255077836266642015:u-scht7a-8i
הגדרות של פרמטרים של שאילתות בחיפוש באינטרנט
| c2coff | |||||||
|---|---|---|---|---|---|---|---|
| תיאור | אופציונלי. הפרמטר c2coff מפעיל או משבית את התכונה חיפוש בסינית מסורתית ובסינית פשוטה. ערך ברירת המחדל של הפרמטר הזה הוא
|
||||||
| דוגמאות | q=google&c2coff=1 |
||||||
| לקוח | |
|---|---|
| תיאור | נדרש. הפרמטר |
| דוגמאות | q=google&client=google-csbe |
| cr | |
|---|---|
| תיאור | אופציונלי. הפרמטר מערכת Google WebSearch קובעת את המדינה של מסמך באמצעות ניתוח של:
בקטע ערכי הפרמטר Country (cr) מופיעה רשימה של ערכים תקינים לפרמטר הזה. |
| דוגמאות | q=Frodo&cr=countryNZ |
| cx | |
|---|---|
| תיאור | נדרש. הפרמטר |
| דוגמאות | q=Frodo&cx=00255077836266642015:u-scht7a-8i |
| סינון | |||||||
|---|---|---|---|---|---|---|---|
| תיאור | אופציונלי. הפרמטר filter מפעיל או משבית את הסינון האוטומטי של תוצאות החיפוש ב-Google. מידע נוסף על מסנני תוצאות החיפוש של Google זמין בקטע סינון אוטומטי במסמך הזה. ערך ברירת המחדל של הפרמטר
הערה: כברירת מחדל, Google מסננת את כל תוצאות החיפוש כדי לשפר את האיכות שלהן. |
||||||
| דוגמאות | q=google&filter=0 |
||||||
| gl | |
|---|---|
| תיאור | אופציונלי. ערך הפרמטר ציון ערך של פרמטר |
| דוגמאות | הבקשה הזו מגדילה את הסיכוי שתוצאות החיפוש באינטרנט יכללו מסמכים שנכתבו בבריטניה: |
| hl | |
|---|---|
| תיאור | אופציונלי. הפרמטר מידע נוסף זמין בקטע שפות הממשק במאמר התאמה של שאילתות להקשרים בינלאומיים והצגת תוצאות. רשימת השפות הנתמכות זמינה במאמר שפות ממשק נתמכות. |
| דוגמאות | הבקשה הזו מתייחסת למודעות ליין בצרפתית. (Vin הוא המונח הצרפתי ליין). q=vin&ip=10.10.10.10&ad=w5&hl=fr |
| hq | |
|---|---|
| תיאור | אופציונלי. הפרמטר |
| דוגמאות | הבקשה הזו מחפשת את המחרוזות 'פיצה' ו 'גבינה'. הביטוי זהה ל-
|
| ie | |
|---|---|
| תיאור | אופציונלי. הפרמטר בקטע קידוד תווים מוסבר מתי כדאי להשתמש בפרמטר הזה. בקטע Character Encoding Schemes מופיעה רשימה של הערכים האפשריים של |
| דוגמאות | q=google&ie=utf8&oe=utf8 |
| lr | |
|---|---|
| תיאור | אופציונלי. הפרמטר מערכת Google WebSearch קובעת את השפה של מסמך באמצעות ניתוח של:
רשימה של ערכים תקינים לפרמטר הזה מופיעה בקטע ערכי אוסף של שפה ( |
| דוגמאות | q=Frodo&lr=lang_en |
| num | |
|---|---|
| תיאור | אופציונלי. הפרמטר ערך ברירת המחדל של הערה: אם המספר הכולל של תוצאות החיפוש קטן ממספר התוצאות המבוקש, כל תוצאות החיפוש הזמינות יוחזרו. |
| דוגמאות | q=google&num=10 |
| oe | |
|---|---|
| תיאור | אופציונלי. הפרמטר בקטע קידוד תווים מוסבר מתי כדאי להשתמש בפרמטר הזה. בקטע Character Encoding Schemes מופיעה רשימה של הערכים האפשריים של |
| דוגמאות | q=google&ie=utf8&oe=utf8 |
| output | |||||||
|---|---|---|---|---|---|---|---|
| תיאור | נדרש. הפרמטר
|
||||||
| דוגמאות | output=xml_no_dtd |
||||||
| q | |
|---|---|
| תיאור | אופציונלי. הפרמטר יש גם מספר מונחי שאילתה מיוחדים שאפשר להשתמש בהם כחלק מהערך של הפרמטר לוח הבקרה של חיפוש Google כולל דוח של השאילתות המובילות שנשלחו באמצעות הפרמטר הערה: הערך שצוין לפרמטר q חייב להיות מוצפן בפורמט URL. |
| דוגמאות | q=vacation&as_oq=london+paris |
| בטיחות | |||||||||
|---|---|---|---|---|---|---|---|---|---|
| תיאור | אופציונלי. הפרמטר
פרטים נוספים על התכונה הזו מופיעים בקטע סינון תוכן למבוגרים בלבד באמצעות חיפוש בטוח. |
||||||||
| דוגמאות | q=adult&safe=high |
||||||||
| start | |
|---|---|
| תיאור | אופציונלי. הפרמטר הפרמטר |
| דוגמאות | start=10 |
| מיון | |
|---|---|
| תיאור | אופציונלי. הפרמטר |
| דוגמאות |
|
| ud | |
|---|---|
| תיאור | אופציונלי. הפרמטר http://www.花井鮨.com הערכים התקפים של הפרמטר הזה הם אם הפרמטר http://www.xn--elq438j.com. הערה: זוהי תכונה בגרסת בטא. |
| דוגמאות | q=google&ud=1 |
חיפוש מתקדם
פרמטרים נוספים של שאילתות שמופיעים מתחת לתמונה רלוונטיים לשאילתות חיפוש מתקדם. כששולחים חיפוש מתקדם, הערכים של כמה פרמטרים (למשל as_eq, as_epq
פרמטרים של שאילתות בחיפוש מתקדם
| as_dt | |
|---|---|
| תיאור | אופציונלי. הפרמטר |
| דוגמאות | as_dt=i,as_dt=e |
| as_epq | |
|---|---|
| תיאור | אופציונלי. הפרמטר |
| דוגמאות | as_epq=abraham+lincoln |
| as_eq | |
|---|---|
| תיאור | אופציונלי. הפרמטר |
| דוגמאות |
|
| as_lq | |
|---|---|
| תיאור | אופציונלי. הפרמטר |
| דוגמאות |
|
| as_nlo | |
|---|---|
| תיאור | אופציונלי. הפרמטר |
| דוגמאות | הקוד הבא מגדיר טווח חיפוש של 5 עד 10, כולל:
|
| as_nhi | |
|---|---|
| תיאור | אופציונלי. הפרמטר |
| דוגמאות | הקוד הבא מגדיר טווח חיפוש של 5 עד 10, כולל:
|
| as_oq | |
|---|---|
| תיאור | אופציונלי. הפרמטר |
| דוגמאות |
|
| as_q | |
|---|---|
| תיאור | אופציונלי. הפרמטר |
| דוגמאות |
|
| as_qdr | |
|---|---|
| תיאור | אופציונלי. הפרמטר
|
| דוגמאות |
בדוגמה הזו מוצגות תוצאות מהשנה האחרונה:
בדוגמה הזו מוצגות תוצאות מ-10 הימים האחרונים:
|
| as_sitesearch | |
|---|---|
| תיאור | אופציונלי. הפרמטר |
| דוגמאות |
|
מונחי שאילתה מיוחדים
חיפוש Google באינטרנט מאפשר שימוש בכמה מונחי שאילתה מיוחדים שנותנים גישה ליכולות נוספות של מנוע החיפוש של Google. צריך לכלול את מונחי השאילתה המיוחדים האלה בערך של פרמטר הבקשה q. בדומה למונחי שאילתות אחרים, צריך להשתמש בתווי בריחה (escape) בכתובת ה-URL של מונחי השאילתות המיוחדים. מספר מונחי שאילתה מיוחדים מכילים נקודתיים (:). גם התו הזה צריך להיות מסומן בתו בריחה (escape) בכתובת ה-URL. ערך ה-escape שלו בכתובת ה-URL הוא %3A.
| קישורים חוזרים [link:] | |
|---|---|
| תיאור | מונח השאילתה הגרסה עם תווי escape של אפשר גם להשתמש בפרמטר הבקשה as_lq כדי לשלוח בקשת הערה: אי אפשר לציין מונחי שאילתה אחרים כשמשתמשים ב- |
| דוגמאות |
|
| חיפוש עם OR בוליאני [ OR ] | |
|---|---|
| תיאור | מונח השאילתה אפשר גם להשתמש בפרמטר הבקשה as_oq כדי לשלוח חיפוש של כל מונח מתוך קבוצת מונחים. הערה: אם בבקשת חיפוש מצוינת השאילתה London+OR+Paris, תוצאות החיפוש יכללו מסמכים שמכילים לפחות אחת משתי המילים האלה. במקרים מסוימים, מסמכים בתוצאות החיפוש עשויים להכיל את שתי המילים. |
| דוגמאות | מחפשים את לונדון או פריז: קלט של משתמשים:
london OR
paris מונח שאילתה:q=london+OR+parisחיפוש של חופשה בלונדון או בפריז: מונח בשאילתה:
q=vacation+london+OR+parisחיפוש של חופשה ואחת מהמילים הבאות: לונדון, פריז או שוקולד: מונח בשאילתה:
q=vacation+london+OR+paris+OR+chocolatesחיפוש של 'חופשה' ו'שוקולדים' וגם 'לונדון' או 'פריז', כאשר המשקל הכי נמוך ניתן ל'שוקולדים': מונח בשאילתה:
q=vacation+london+OR+paris+chocolatesחיפוש של המילים 'חופשה', 'שוקולדים' ו'פרחים' במסמכים שכוללים גם את המילה 'לונדון' או 'פריז': מונח בשאילתה:
q=vacation+london+OR+paris+chocolates+flowersחיפוש של חופשה ואחת מהמילים לונדון או פריז, וגם חיפוש של אחת מהמילים שוקולד או פרחים: מונח בשאילתה: q=vacation+london+OR+paris+chocolates+OR+flowers |
| החרגת מונח שאילתה [-] | |
|---|---|
| תיאור | מונח השאילתה exclude ( הגרסה עם תווי escape של החרגת מונח שאילתה שימושית כשמונח חיפוש מסוים כולל יותר ממשמעות אחת. לדוגמה, אם מחפשים את המילה bass, יכולות להתקבל תוצאות לגבי דג או לגבי מוזיקה. אם חיפשתם מסמכים בנושא דגים, תוכלו להשתמש במונח השאילתה exclude כדי להחריג מהתוצאות מסמכים בנושא מוזיקה. אפשר גם להשתמש בפרמטר הבקשה as_eq כדי להחריג מתוצאות החיפוש מסמכים שתואמים למילה או לביטוי מסוימים. |
| דוגמאות | קלט של משתמשים: bass -musicמונח שאילתה: q=bass+%2Dmusic |
| החרגת סוג קובץ [ -filetype: ] | |
|---|---|
| תיאור | השאילתה הגרסה עם תווי escape של הערה: כדי להחריג כמה סוגי קבצים מתוצאות החיפוש, אפשר להוסיף עוד מונחי שאילתה סוגי הקבצים שנתמכים על ידי Google כוללים:
יכול להיות שבעתיד נוסיף עוד סוגי קבצים. רשימה עדכנית תמיד זמינה בשאלות הנפוצות בנושא סוגי קבצים של Google. |
| דוגמאות | בדוגמה הזו מוצגים מסמכים שמוזכר בהם המונח Google, אבל הם לא מסמכי PDF: בדוגמה הזו, הפונקציה מחזירה מסמכים שמוזכרת בהם המילה Google, אבל מחריגה מסמכי PDF ומסמכי Word: |
| סינון לפי סוג הקובץ [ filetype: ] | |
|---|---|
| תיאור | המונח הגרסה עם תווי escape של כדי להגביל את תוצאות החיפוש למסמכים שתואמים לאחת מכמה סיומות קבצים, אפשר להוסיף עוד מונחי שאילתה כברירת מחדל, תוצאות החיפוש יכללו מסמכים עם כל סיומת קובץ. סוגי הקבצים שנתמכים על ידי Google כוללים:
יכול להיות שבעתיד נוסיף עוד סוגי קבצים. רשימה עדכנית תמיד זמינה בשאלות הנפוצות בנושא סוגי קבצים של Google. |
| דוגמאות | בדוגמה הזו מוצגים מסמכי PDF שמוזכר בהם המונח Google: בדוגמה הזו מוצגים מסמכי PDF ו-Word שמוזכרת בהם המילה Google: |
| הכללת מונח שאילתה [+] | |
|---|---|
| תיאור | מונח השאילתה include (+) מציין שמילה או ביטוי צריכים להופיע בכל המסמכים שנכללים בתוצאות החיפוש. כדי להשתמש במונח השאילתה include, צריך להוסיף לפני המילה או הביטוי שרוצים לכלול בכל תוצאות החיפוש את הסימן + (פלוס). הגרסה של כדאי להשתמש ב- |
| דוגמאות | קלט של משתמשים: Star Wars Episode +Iמונח שאילתה: q=Star+Wars+Episode+%2BI |
| חיפוש רק קישורים, כל המונחים [ allinlinks: ] | |
|---|---|
| תיאור | המונח אם שאילתת החיפוש כוללת את מונח השאילתה הגרסה עם תווי escape של |
| דוגמאות | קלט של משתמשים:allinlinks: Google searchמונח שאילתה: q=allinlinks%3A+Google+search |
| חיפוש ביטויים | |
|---|---|
| תיאור | מונח השאילתה לחיפוש ביטוי (") מאפשר לכם לחפש ביטויים שלמים על ידי הוספת מירכאות סביב הביטויים או על ידי חיבור שלהם באמצעות מקפים. הגרסה של חיפוש ביטויים שימושי במיוחד כשמחפשים ציטוטים מפורסמים או שמות פרטיים. אפשר גם להשתמש בפרמטר הבקשה as_epq כדי לשלוח חיפוש של צירוף מילים. |
| דוגמאות | קלט של משתמשים:"Abraham Lincoln"מונח שאילתה: q=%22Abraham+Lincoln%22 |
| מידע על מסמך אינטרנט [info:] | |
|---|---|
| תיאור | השאילתה הגרסה של הערה: אי אפשר לציין מונחי שאילתה אחרים כשמשתמשים ב- |
| דוגמאות | קלט של משתמשים: info:www.google.comמונח שאילתה: q=info%3Awww.google.com |
דוגמאות לשאילתות לגבי תמונות
בדוגמאות הבאות מוצגות כמה בקשות HTTP לתמונות, כדי להמחיש את השימוש בפרמטרים שונים של שאילתות. הגדרות של הפרמטרים השונים של השאילתות מופיעות בקטע 'הגדרות של פרמטרים של שאילתות לתמונות' במסמך הזה.
הבקשה הזו היא ל-5 התוצאות הראשונות (start=0&num=5) של מונח החיפוש 'קוף' (q=monkey), מסוג הקובץ .png. לבסוף, בשאילתה מצוינים ערכים לפרמטרים client, output ו-cx, שכולם נדרשים.
http://www.google.com/cse? searchtype=image start=0 &num=5 &q=monkey &as_filetype=png &client=google-csbe &output=xml_no_dtd &cx=00255077836266642015:u-scht7a-8i
פרמטרים של שאילתות בחיפוש תמונות
| as_filetype | |
|---|---|
| תיאור | אופציונלי. מחזירה תמונות מסוג מסוים. הערכים המותרים הם: |
| דוגמאות | q=google&as_filetype=png |
| imgsz | |
|---|---|
| תיאור | אופציונלי. מחזירה תמונות בגודל שצוין. האפשרויות לגודל הן:
|
| דוגמאות | q=google&as_filetype=png&imgsz=icon |
| imgtype | |
|---|---|
| תיאור | אופציונלי. הפונקציה מחזירה תמונות מסוג מסוים, שיכול להיות אחד מהסוגים הבאים:
|
| דוגמאות | q=google&as_filetype=png&imgtype=photo |
| imgc | |
|---|---|
| תיאור | אופציונלי. החזרת תמונות בשחור-לבן, בגווני אפור או בצבע:
|
| דוגמאות | q=google&as_filetype=png&imgc=gray |
| imgcolor | |
|---|---|
| תיאור | אופציונלי. מחזירה תמונות עם צבע דומיננטי ספציפי:
|
| דוגמאות | q=google&as_filetype=png&imgcolor=yellow |
| as_rights | |
|---|---|
| תיאור | אופציונלי. מסננים לפי רישוי. הערכים הנתמכים כוללים:
|
| דוגמאות | q=cats&as_filetype=png&as_rights=cc_attribute |
מגבלות של בקשות
בטבלה הבאה מפורטות מגבלות על בקשות החיפוש שאתם שולחים ל-Google:
| רכיב | מגבלה | תגובה |
|---|---|---|
| אורך הבקשה לחיפוש | 2,048 בייטים | |
| מספר מונחי השאילתה | 10 | כולל מונחים בפרמטרים הבאים: q, as_epq, as_eq, as_lq, as_oq, as_q |
| מספר התוצאות | 20 | אם מגדירים את הפרמטר num למספר גדול מ-20, יוחזרו רק 20 תוצאות. כדי לקבל יותר תוצאות, צריך לשלוח כמה בקשות ולהגדיל את הערך של הפרמטר start בכל בקשה. |
התאמה של שאילתות ותוצאות לשפות שונות
שירות Google WebSearch מאפשר לכם לחפש מסמכים בכמה שפות. אפשר לציין את קידוד התווים שבאמצעותו תפורש בקשת ה-HTTP ותקודד תגובת ה-XML (באמצעות פרמטרי החיפוש ie ו-oe). אפשר גם לסנן את התוצאות כך שיכללו רק מסמכים שנכתבו בשפות מסוימות.
בקטעים הבאים נדון בבעיות שקשורות לחיפוש בכמה שפות:
קידוד תווים
שרתים שולחים נתונים, כמו דפי אינטרנט, לסוכני משתמש, כמו דפדפנים, כרצף של בייטים מקודדים. סוכן המשתמש מפענח את הבייטים לרצף של תווים. כששולחים בקשות לשירות WebSearch, אפשר לציין את ערכות הקידוד גם לשאילתת החיפוש וגם לתשובת ה-XML שמתקבלת.
אפשר להשתמש בפרמטר הבקשה ie כדי לציין את מנגנון הקידוד של התווים בבקשת ה-HTTP. אפשר גם להשתמש בפרמטר oe כדי לציין את סכמת הקידוד שבה Google צריכה להשתמש כדי לקודד את תגובת ה-XML. אם אתם משתמשים בשיטת קידוד שונה מ-ISO-8859-1 (או מ-latin1), עליכם לוודא שציינתם את הערכים הנכונים לפרמטרים ie ו-oe.
הערה: אם אתם מספקים פונקציונליות חיפוש בכמה שפות, מומלץ להשתמש בערך הקידוד utf8 (UTF-8) גם בפרמטרים ie וגם בפרמטרים oe.
רשימה מלאה של הערכים שאפשר להשתמש בהם לפרמטרים ie ו-oe מופיעה בנספח Character Encoding Schemes.
מידע כללי נוסף על קידוד תווים זמין בכתובת http://www.w3.org/TR/REC-html40/charset.html.
שפות הממשק
אפשר להשתמש בפרמטר הבקשה hl כדי לזהות את השפה של הממשק הגרפי. יכול להיות שערך הפרמטר hl ישפיע על תוצאות החיפוש ב-XML, במיוחד בשאילתות בינלאומיות שבהן לא צוינה במפורש הגבלת שפה (באמצעות הפרמטר lr). במקרים כאלה, פרמטר hl עשוי לקדם תוצאות חיפוש באותה שפה של שפת הקלט של המשתמש.
מומלץ להגדיר במפורש את הפרמטר hl בתוצאות החיפוש כדי להבטיח ש-Google תבחר את תוצאות החיפוש האיכותיות ביותר לכל שאילתה.
בקטע שפות הממשק הנתמכות מופיעה רשימה מלאה של הערכים התקינים לפרמטר hl.
חיפוש מסמכים שנכתבו בשפות ספציפיות
אתם יכולים להשתמש בפרמטר הבקשה lr כדי להגביל את תוצאות החיפוש למסמכים שנכתבו בשפה מסוימת או בקבוצה מסוימת של שפות.
הפרמטר lr תומך באופרטורים בוליאניים כדי לאפשר לכם לציין כמה שפות שצריך לכלול (או לא לכלול) בתוצאות החיפוש.
בדוגמאות הבאות אפשר לראות איך אפשר להשתמש באופרטורים בוליאניים כדי לבקש מסמכים בשפות שונות.
למסמכים שנכתבו ביפנית:
lr=lang_jp
למסמכים שנכתבו באיטלקית או בגרמנית:
lr=lang_it|lang_de
למסמכים שלא נכתבו בהונגרית או בצ'כית:
lr=(-lang_hu).(-lang_cs)
רשימה מלאה של הערכים האפשריים של הפרמטר lr מופיעה בקטע ערכים של אוסף שפות, ובקטע אופרטורים בוליאניים מוסבר באופן מלא איך להשתמש באופרטורים האלה.
חיפוש בסינית פשוטה ובסינית מסורתית
סינית פשוטה וסינית מסורתית הן שתי גרסאות של כתב בשפה הסינית. אותו מושג יכול להיות כתוב בצורה שונה בכל וריאציה. אם מזינים שאילתה באחת מהגרסאות, שירות Google WebSearch יכול להחזיר תוצאות שכוללות דפים בשתי הגרסאות.
כדי להשתמש בתכונה הזו:
- מגדירים את פרמטר הבקשה c2coff לערך 0
ו - מבצעים את אחת מהפעולות האלה:
בדוגמה הבאה מוצגים פרמטרים של שאילתה שצריך לכלול בבקשה לתוצאות בסינית פשוטה ובסינית מסורתית. (שימו לב שהדוגמה לא כוללת מידע נוסף שנדרש, כמו הלקוח).
search?hl=zh-CN
&lr=lang_zh-TW|lang_zh-CN
&c2coff=0סינון התוצאות
יש כמה דרכים לסנן את תוצאות החיפוש בחיפוש האינטרנט של Google:
סינון אוטומטי של תוצאות החיפוש
במסגרת המאמצים שלנו לספק את תוצאות החיפוש הרלוונטיות ביותר, Google משתמשת בשתי שיטות לסינון אוטומטי של תוצאות חיפוש שנחשבות לא רצויות באופן כללי:
-
תוכן כפול – אם יש כמה מסמכים שהמידע שבהם זהה, רק המסמך הרלוונטי ביותר באותה קבוצה ייכלל בתוצאות החיפוש.
-
עומס ממארח – אם יש הרבה תוצאות חיפוש מאותו אתר, יכול להיות ש-Google לא תציג את כל התוצאות מהאתר הזה, או שהיא תציג את התוצאות במקום נמוך יותר בדירוג ממה שהיה קורה אחרת.
מומלץ להשאיר את המסננים האלה מופעלים עבור בקשות חיפוש רגילות, כי הם משפרים באופן משמעותי את האיכות של רוב תוצאות החיפוש. עם זאת, אפשר לעקוף את המסננים האוטומטיים האלה על ידי הגדרת פרמטר השאילתה filter לערך 0 בבקשת החיפוש.
סינון לפי שפה ומדינה
שירות Google WebSearch מחזיר תוצאות מתוך אינדקס ראשי של כל מסמכי האינטרנט. האינדקס הראשי מכיל אוספי משנה של מסמכים שמקובצים לפי מאפיינים מסוימים, כולל שפה ומדינת המוצא.
אתם יכולים להשתמש בפרמטרים של הבקשות lr ו-cr כדי להגביל את תוצאות החיפוש לאוספי משנה של מסמכים שנכתבו בשפות מסוימות או שמקורם במדינות מסוימות, בהתאמה.
מערכת Google WebSearch קובעת את השפה של מסמך באמצעות ניתוח של:
- הדומיין ברמה העליונה (TLD) של כתובת ה-URL של המסמך
- מטא תגים של שפה בתוך המסמך
- השפה הראשית שבה כתוב הטקסט במסמך
מידע נוסף על הגבלת התוצאות לפי שפה זמין גם בהגדרה של הפרמטר lr, בקטע בנושא חיפוש
מסמכים שנכתבו בשפות ספציפיות ובערכים של אוסף שפות שאפשר להשתמש בהם כערכים של הפרמטר lr.
מערכת Google WebSearch קובעת את המדינה של מסמך באמצעות ניתוח של:
- הדומיין ברמה העליונה (TLD) של כתובת ה-URL של המסמך
- המיקום הגיאוגרפי של כתובת ה-IP של שרת האינטרנט
כדי לקבל מידע נוסף על הגבלת התוצאות לפי מדינת המקור, אפשר לעיין גם בהגדרה של הפרמטר cr ובערכים של אוסף המדינות שאפשר להשתמש בהם כערכים של הפרמטר cr.
הערה: אפשר לשלב ערכים של שפה עם ערכים של מדינה כדי להתאים אישית את תוצאות החיפוש. לדוגמה, אתם יכולים לבקש מסמכים שנכתבו בצרפתית ומגיעים מצרפת או מקנדה, או לבקש מסמכים שמגיעים מהולנד ולא נכתבו באנגלית. הפרמטרים lr ו-cr תומכים באופרטורים בוליאניים.
סינון תוכן למבוגרים בלבד באמצעות החיפוש הבטוח
הרבה לקוחות של Google לא רוצים להציג תוצאות חיפוש של אתרים שמכילים תוכן למבוגרים. בעזרת מסנן החיפוש הבטוח שלנו, אתם יכולים לסנן תוצאות חיפוש שמכילות תוכן למבוגרים בלבד ולהסיר אותן. המסננים של Google משתמשים בטכנולוגיה קניינית כדי לבדוק מילות מפתח, ביטויים וכתובות URL. אמנם אין מסננים מדויקים ב-100%, אבל החיפוש הבטוח יסיר את הרוב המכריע של התוכן למבוגרים בלבד מתוצאות החיפוש.
Google משתדלת להקפיד שהחיפוש הבטוח יהיה עדכני ומקיף ככל האפשר. לשם כך, היא סורקת את האינטרנט באופן רציף ומשלבת עדכונים על סמך הצעות של משתמשים.
החיפוש הבטוח זמין בשפות הבאות:
| הולנדית אנגלית צרפתית גרמנית |
איטלקית פורטוגזית (ברזיל) ספרדית סינית מסורתית |
אפשר לשנות את רמת הסינון של תוצאות החיפוש ב-Google כדי להסיר תוכן למבוגרים בלבד באמצעות פרמטר השאילתה safe. בטבלה הבאה מוסברות ההגדרות של 'חיפוש בטוח' ב-Google ואיך ההגדרות האלה ישפיעו על תוצאות החיפוש:
| רמת החיפוש הבטוח | תיאור |
|---|---|
| גבוהה | הפעלת גרסה מחמירה יותר של חיפוש בטוח. |
| בינונית | חסימה של דפי אינטרנט שמכילים פורנוגרפיה ותוכן מיני בוטה אחר. |
| מושבתת | לא מסנן תוכן למבוגרים בלבד מתוצאות החיפוש. |
* הגדרת ברירת המחדל של החיפוש הבטוח היא מושבת.
אם החיפוש הבטוח מופעל ובתוצאות מופיעים אתרים שמכילים תוכן פוגע, אפשר לשלוח אימייל עם כתובת ה-URL של האתר אל safesearch@google.com, ואנחנו נבדוק את האתר.
תוצאות ב-XML
- Google XML Results DTD
- מידע על תגובת XML
- XML תוצאות של שאילתות חיפוש רגילות ומתקדמות
- חיפוש רגיל/מתקדם: שאילתה לדוגמה ותגובת XML
- חיפוש רגיל/מתקדם: תגי XML
DTD של תוצאות XML של Google
Google משתמשת באותו DTD כדי לתאר את פורמט ה-XML לכל סוגי תוצאות החיפוש. הרבה תגים ומאפיינים רלוונטיים לכל סוגי החיפושים. עם זאת, חלק מהתגים רלוונטיים רק לסוגים מסוימים של חיפושים. לכן, יכול להיות שההגדרות ב-DTD פחות מחמירות מההגדרות שמופיעות במסמך הזה.
במסמך הזה מתוארים ההיבטים של DTD שרלוונטיים ל-WebSearch. כשמעיינים ב-DTD, אם עובדים על WebSearch, אפשר להתעלם בבטחה מתגים וממאפיינים שלא מתועדים כאן. אם יש הבדל בהגדרה בין ה-DTD לבין המסמכים, מצוין הדבר במסמך הזה.
Google יכולה להחזיר תוצאות ב-XML עם או בלי הפניה ל-DTD העדכני ביותר. ה-DTD הוא מדריך שעוזר לאדמינים של חיפוש ולמנתחי XML להבין את תוצאות ה-XML של Google. מכיוון שהדקדוק של ה-XML של Google עשוי להשתנות מעת לעת, לא מומלץ להגדיר את המנתח כך שישתמש ב-DTD כדי לאמת כל תוצאת XML.
בנוסף, לא מומלץ להגדיר את מנתח ה-XML כך שיאחזר את ה-DTD בכל פעם ששולחת בקשת חיפוש. Google מעדכנת את ה-DTD לעיתים רחוקות, והבקשות האלה יוצרות עיכובים מיותרים ודרישות רוחב פס מיותרות.
Google ממליצה להשתמש בפורמט הפלט xml_no_dtd כדי לקבל תוצאות ב-XML. אם מציינים את פורמט הפלט xml בבקשת החיפוש, ההבדל היחיד הוא הכללת השורה הבאה בתוצאות ה-XML:
<!DOCTYPE GSP SYSTEM "google.dtd">אפשר לגשת ל-DTD העדכני בכתובת http://www.google.com/google.dtd.
שימו לב: יכול להיות שחלק מהתכונות ב-DTD לא יהיו זמינות או נתמכות בשלב הזה.
מידע על תגובת XML
- כל ערכי הרכיבים הם HTML תקין שמתאים להצגה, אלא אם צוין אחרת בהגדרות של תגי ה-XML.
- חלק מהערכים של האלמנטים הם כתובות URL שצריך לקודד ב-HTML לפני שהם מוצגים.
- מנתח ה-XML צריך להתעלם מתגים וממאפיינים שלא מתועדים. כך האפליקציה תוכל להמשיך לפעול ללא שינוי אם Google תוסיף עוד תכונות לפלט ה-XML.
- כשכוללים תווים מסוימים כערכים בתגי XML, צריך להוסיף להם תווי בריחה. מעבד ה-XML אמור להמיר את הישויות האלה בחזרה לתווים המתאימים. אם לא ממירים את הישויות בצורה נכונה, יכול להיות שהדפדפן יעבד את התו & כ-&, למשל.
התווים האלה מפורטים במסמכים של תקן ה-XML, והם מופיעים בטבלה שלמטה:
דמות טפסים שהוצאו משימוש ישות קוד התו סימן 'גם' (אמפרסנד) & & & גרש ' ' ' מירכאות כפולות " " " גדול מ- > > > קטן מ- < < <
תוצאות XML לשאילתות חיפוש רגילות ומתקדמות
חיפוש רגיל או מתקדם: שאילתה לדוגמה ותוצאת XML
בדוגמה הזו של בקשת WebSearch, מבקשים 10 תוצאות (num=10) לגבי מונח החיפוש socer (q=socer), שהוא המילה soccer עם שגיאת כתיב מכוונת לצורך הדוגמה).
http://www.google.com/search?
q=socer
&hl=en
&start=10
&num=10
&output=xml
&client=google-csbe
&cx=00255077836266642015:u-scht7a-8i
הבקשה הזו מחזירה את תוצאת ה-XML שמוצגת בהמשך. שימו לב שיש כמה הערות בתוצאת ה-XML שמציינות איפה יופיעו תגים מסוימים שלא נכללים בתוצאה.
<?xml version="1.0" encoding="ISO-8859-1" standalone="no" ?>
<GSP VER="3.2">
<TM>0.452923</TM>
<Q>socer</Q>
<PARAM name="cx" value="00255077836266642015:u-scht7a-8i" original_value="00255077836266642015%3Au-scht7a-8i"/>
<PARAM name="hl" value="en" original_value="en"/>
<PARAM name="q" value="socer" original_value="socer"/>
<PARAM name="output" value="xml" original_value="xml"/>
<PARAM name="client" value="google-csbe" original_value="google-csbe"/>
<PARAM name="num" value="10" original_value="10"/>
<Spelling>
<Suggestion q="soccer"><b><i>soccer</i></b></Suggestion>
</Spelling>
<Context>
<title>Sample Vacation CSE</title>
<Facet>
<FacetItem>
<label>restaurants</label>
<anchor_text>restaurants</anchor_text>
</FacetItem>
<FacetItem>
<label>wineries</label>
<anchor_text>wineries</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>golf_courses</label>
<anchor_text>golf courses</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>hotels</label>
<anchor_text>hotels</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>nightlife</label>
<anchor_text>nightlife</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>soccer_sites</label>
<anchor_text>soccer sites</anchor_text>
</FacetItem>
</Facet>
</Context>
<RES SN="1" EN="10">
<M>6080</M>
/*
* The FI tag after the comment indicates that the result
* set has been filtered. If the number of results were exact, the
* FI tag would be replaced by an XT tag in the same format.
*/
<FI />
<NB>
/*
* Since the request is for the first page of results, the PU tag,
* which contains a link to the previous page of search results,
* is not included in this XML result. If the sample result did include
* a previous page of results, it would be listed here, in the same format
* as the NU tag on the following line
*/
<NU>/search?q=socer&hl=en&lr=&ie=UTF-8&output=xml&client=test&start=10&sa=N</NU>
</NB>
<R N="1">
<U>http://www.soccerconnection.net/</U>
<UE>http://www.soccerconnection.net/</UE>
<T>SoccerConnection.net</T>
<CRAWLDATE>May 21, 2007</CRAWLDATE>
<S><b>soccer</b>; players; coaches; ball; world cup;<b>...</b></S>
<Label>transcodable_pages</Label>
<Label>accessible</Label>
<Label>soccer_sites</Label>
<LANG>en</LANG>
<HAS>
<DI>
<DT>SoccerConnection.net</DT>
<DS>Post your <b>soccer</b> resume directly on the Internet.</DS>
</DI>
<L/>
<C SZ="8k" CID="kWAPoYw1xIUJ"/>
<RT/>
</HAS>
</R>
/*
* The result includes nine more results, each enclosed by an R tag.
*/
</RES>
</GSP>
חיפוש רגיל/מתקדם: תגי XML
תגובות XML לבקשות חיפוש רגילות ולבקשות חיפוש מתקדם משתמשות באותו סט של תגי XML. תגי ה-XML האלה מוצגים בדוגמה של XML למעלה ומוסברים בטבלאות שלמטה.
תגי ה-XML שבהמשך מופיעים בסדר אלפביתי לפי שם התג. כל הגדרה של תג כוללת תיאור של התג, דוגמה שמראה איך התג יופיע בתוצאת XML והפורמט של תוכן התג. אם התג הוא תג משנה של תג XML אחר, או אם לתג יש תגי משנה או מאפיינים משלו, המידע הזה מופיע גם הוא בטבלת ההגדרה של התג.
יכול להיות שסמלים מסוימים יוצגו לצד חלק מתגי המשנה בהגדרות שבהמשך. לפניכם פירוט של הסמלים והמשמעויות שלהם:
* = אפס מופעים או יותר של תג המשנה
+ = מופע אחד או יותר של תג המשנה
| A | B | מ | D | G | H | I | L | M | צפ' | P | רבעון | R | דר' | T | U | X |
| anchor_text | |
|---|---|
| הגדרה | התג <anchor_text> מציין את הטקסט שצריך להציג למשתמשים כדי לזהות תווית לחידוד שמשויכת לקבוצת תוצאות חיפוש. תוויות לסינון תוצאות מחליפות תווים לא אלפאנומריים בקו תחתון, ולכן לא מומלץ להציג את הערך של התג <label> בממשק המשתמש. במקום זאת, צריך להציג את הערך של התג <anchor_text>. |
| דוגמה | <anchor_text>golf courses</anchor_text> |
| תג משנה של | FacetItem |
| פורמט התוכן | טקסט |
| חסום | |
|---|---|
| הגדרה | התג הזה כולל את התוכן של בלוק בשורה של תוצאת מבצע. לכל בלוק יש תגי משנה T, U ו-L. תג T לא ריק מציין שהבלוק מכיל טקסט. תגי U ו-L לא ריקים מציינים שהבלוק מכיל קישור (עם כתובת URL שמופיעה בתג המשנה U וטקסט מקושר שמופיע בתג המשנה L). |
| תגי משנה | T, U, L |
| תג משנה של | BODY_LINE |
| פורמט התוכן | ריק |
| BODY_LINE | |
|---|---|
| הגדרה | התג הזה כולל את התוכן של שורה בגוף התוצאה המקודמת. כל שורה בגוף ההודעה מורכבת מכמה תגי BLOCK, שמכילים טקסט או קישור עם כתובת URL וטקסט מקושר. |
| תגי משנה | BLOCK* |
| תג משנה של | SL_MAIN |
| פורמט התוכן | ריק |
| C | ||||||||||
|---|---|---|---|---|---|---|---|---|---|---|
| הגדרה | התג <C> מציין ששירות WebSearch יכול לאחזר גרסה ששמורה במטמון של כתובת ה-URL הזו של תוצאת החיפוש. אי אפשר לאחזר דפים שנשמרו במטמון באמצעות API בפורמט XML, אבל אפשר להפנות משתמשים אל www.google.com כדי לגשת לתוכן הזה. |
|||||||||
| מאפיינים |
|
|||||||||
| דוגמה | <C SZ="6k" CID="kvOXK_cYSSgJ" /> | |||||||||
| תג משנה של | HAS | |||||||||
| פורמט התוכן | ריק | |||||||||
| C2C | |
|---|---|
| הגדרה | התג <C2C> מציין שהתוצאה מתייחסת לדף בשפה הסינית המסורתית. התג הזה מופיע רק אם מפעילים את האפשרות חיפוש בסינית פשוטה ובסינית מסורתית. מידע נוסף על הפעלה והשבתה של התכונה הזו זמין בהגדרה של פרמטר השאילתה c2coff. |
| פורמט התוכן | טקסט |
| הקשר | |
|---|---|
| הגדרה | התג <Context> כולל רשימה של תוויות לחידוד שמשויכות לקבוצה של תוצאות חיפוש. |
| דוגמה | <Context> |
| תגי משנה | title, Facet+ |
| פורמט התוכן | מאגר |
| CRAWLDATE | |
|---|---|
| הגדרה | התג <CRAWLDATE> מציין את התאריך שבו הדף נסרק לאחרונה. |
| דוגמה | <CRAWLDATE>May 21, 2005</CRAWLDATE> |
| תג משנה של | R |
| פורמט התוכן | טקסט |
| DI | |
|---|---|
| הגדרה | התג <DI> כולל מידע על קטגוריות של Open Directory Project (ODP) עבור תוצאת חיפוש יחידה. |
| דוגמה | <DI> |
| תגי משנה | DT?, DS? |
| תג משנה של | HAS |
| פורמט התוכן | ריק |
| DS | |
|---|---|
| הגדרה | התג <DS> מספק את הסיכום שמופיע עבור קטגוריה אחת בספריית ה-ODP. |
| דוגמה | <DS>פרסם את קורות החיים שלך בנושא <0x0A> <b>כדורגל</b> ישירות באינטרנט.</DS> |
| תג משנה של | DI |
| פורמט התוכן | טקסט (יכול להכיל HTML) |
| DT | |
|---|---|
| הגדרה | התג <DT> מספק את הכותרת של קטגוריה יחידה שמופיעה בספריית ODP. |
| דוגמה | <DT>SoccerConnection.net</DT> |
| תג משנה של | DI |
| פורמט התוכן | טקסט (יכול להכיל HTML) |
| מאפיין | |
|---|---|
| הגדרה | התג <Facet> מכיל קיבוץ לוגי של תגי <FacetItem>. אפשר ליצור את הקבוצות האלה באמצעות פורמט המפרט של XML של Programmable Search Engine. אם לא יוצרים את הקיבוצים האלה, התג results_xml_tag_Context><Context יכיל עד ארבעה תגים <Facet>. הפריטים בכל תג <Facet> יקובצו לצורכי תצוגה, אבל יכול להיות שלא יהיה ביניהם קשר לוגי. |
| דוגמה | <Facet> |
| תגי משנה | FacetItem+, title+ |
| תג משנה של | הֶקשר |
| פורמט התוכן | מאגר |
| FacetItem | |
|---|---|
| הגדרה | התג <FacetItem> כולל מידע על תווית צמצום שמשויכת לקבוצת תוצאות חיפוש. |
| דוגמה | <FacetItem> |
| תגי משנה | label, anchor_text+ |
| תג משנה של | Facet |
| פורמט התוכן | FacetItem |
| FI | |
|---|---|
| הגדרה | התג <FI> משמש כסימן שמציין אם בוצע סינון של המסמך בחיפוש. מידע נוסף על מסנני תוצאות החיפוש של Google מופיע בקטע סינון אוטומטי במסמך הזה. |
| דוגמה | <FI /> |
| תג משנה של | RES |
| פורמט התוכן | ריק |
| GSP | |||||||
|---|---|---|---|---|---|---|---|
| הגדרה | התג <GSP> כולל את כל הנתונים שמוחזרים בתוצאות החיפוש של Google ב-XML. GSP הוא קיצור של Google Search Protocol (פרוטוקול חיפוש Google). |
||||||
| מאפיינים |
|
||||||
| דוגמה | <GSP VER="3.2"> | ||||||
| תגי משנה | PARAM+, Q, RES?, TM | ||||||
| פורמט התוכן | ריק | ||||||
| HAS | |
|---|---|
| הגדרה | התג <HAS> כולל מידע על פרמטרים מיוחדים של בקשות חיפוש שנתמכים בכתובת URL מסוימת.
הערה: ההגדרה של <HAS> ב-WebSearch מגבילה יותר מאשר ב-DTD. |
| תגי משנה | DI?, L?, C?, RT? |
| תג משנה של | R |
| ISURL | |
|---|---|
| הגדרה | Google מחזירה את התג <ISURL> אם שאילתת החיפוש המשויכת היא כתובת URL. |
| תג משנה של | GSP |
| פורמט התוכן | ריק |
| L | |
|---|---|
| הגדרה | הנוכחות של התג <L> מציינת ששירות WebSearch יכול למצוא אתרים אחרים שמקשרים לכתובת ה-URL של תוצאת החיפוש הזו. כדי למצוא אתרים כאלה, צריך להשתמש במונח השאילתה המיוחד link:. |
| תג משנה של | HAS |
| פורמט התוכן | ריק |
| תווית | |
|---|---|
| הגדרה | התג <label> מציין תווית לסינון תוצאות החיפוש שמתקבלות. כדי להשתמש בתווית לסינון, מוסיפים את המחרוזת more:[[label tag value]] לערך של הפרמטר q בבקשת ה-HTTP אל Google, כמו בדוגמה הבאה. שימו לב שצריך להוסיף לערך הזה escape לפני ששולחים את השאילתה אל Google. This example uses the refinement label golf_courses to הערה: התג <label> שונה מהתג <Label>, שמזהה תווית לסינון תוצאות שמשויכת לכתובת URL מסוימת בתוצאות החיפוש. |
| דוגמה | <label>golf_courses</label> |
| תג משנה של | FacetItem |
| פורמט התוכן | טקסט |
| LANG | |
|---|---|
| הגדרה | התג <LANG> מכיל את הניחוש הטוב ביותר של Google לגבי שפת תוצאת החיפוש. |
| דוגמה | <LANG>en</LANG> |
| תג משנה של | R |
| פורמט התוכן | טקסט |
| M | |
|---|---|
| הגדרה | התג <M> מציין את המספר הכולל המשוער של תוצאות החיפוש. הערה: יכול להיות שהאומדן הזה לא מדויק. |
| דוגמה | <M>16200000</M> |
| תג משנה של | RES |
| פורמט התוכן | טקסט |
| NB | |
|---|---|
| הגדרה | התג <NB> כולל מידע על ניווט – קישורים לדף הבא של תוצאות החיפוש או לדף הקודם של תוצאות החיפוש – עבור קבוצת התוצאות. הערה: התג הזה מופיע רק אם יש תוצאות נוספות. |
| דוגמה | <NB> |
| תגי משנה | NU?, PU? |
| תג משנה של | RES |
| פורמט התוכן | ריק |
| NU | |
|---|---|
| הגדרה | התג <NU> מכיל קישור יחסי לדף הבא של תוצאות החיפוש. |
| דוגמה | <NU>/search?q=flowers&num=10&hl=en&ie=UTF-8 &output=xml&client=test&start=10</NU> |
| תג משנה של | NB |
| פורמט התוכן | טקסט (כתובת URL יחסית) |
| PARAM | |||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| הגדרה | התג <PARAM> מזהה פרמטר קלט שנשלח בבקשת ה-HTTP שמשויכת לתוצאת ה-XML. המידע על הפרמטר מופיע במאפייני התג – name, value, original_value – ויהיה תג PARAM אחד לכל פרמטר שנשלח בבקשת ה-HTTP. |
||||||||||||
| מאפיינים |
|
||||||||||||
| דוגמה | <PARAM name="cr" value="countryNZ" original_value="countryNZ" /> | ||||||||||||
| תג משנה של | GSP | ||||||||||||
| פורמט התוכן | רמה למתקדמים מאוד | ||||||||||||
| PU | |
|---|---|
| הגדרה | התג <PU> מספק קישור יחסי לדף הקודם של תוצאות החיפוש. |
| דוגמה | <PU>/search?q=flowers&num=10&hl=en&output=xml &client=test&start=10</PU> |
| תג משנה של | NB |
| פורמט התוכן | טקסט (כתובת URL יחסית) |
| Q | |
|---|---|
| הגדרה | התג <Q> מזהה את שאילתת החיפוש שהוגשה בבקשת ה-HTTP שמשויכת לתוצאת ה-XML. |
| דוגמה | <Q>פיצה</Q> |
| תג משנה של | GSP |
| פורמט התוכן | טקסט |
| R | ||||||||||
|---|---|---|---|---|---|---|---|---|---|---|
| הגדרה | התג <R> כולל את הפרטים של תוצאת חיפוש ספציפית. הערה: ההגדרה של התג <R> עבור WebSearch מגבילה יותר מאשר ב-DTD. |
|||||||||
| מאפיינים |
|
|||||||||
| תגי משנה | U, UE, T?, CRAWLDATE, S?, LANG?, HAS | |||||||||
| תג משנה של | RES | |||||||||
| RES | ||||||||||
|---|---|---|---|---|---|---|---|---|---|---|
| הגדרה | התג <RES> כולל את קבוצת התוצאות האישיות של החיפוש ופרטים על התוצאות האלה. |
|||||||||
| מאפיינים |
|
|||||||||
| דוגמה | <RES SN="1" EN="10"> | |||||||||
| תגי משנה | M, FI?, XT?, NB?, R* | |||||||||
| תג משנה של | GSP | |||||||||
| פורמט התוכן | ריק | |||||||||
| S | |
|---|---|
| הגדרה | התג <S> מכיל קטע מתוצאת חיפוש שבו מונחי השאילתה מודגשים. מעברי שורה כלולים בקטע כדי שהטקסט יעבור לשורה הבאה בצורה תקינה. |
| דוגמה | <S>Washington (CNN) -- A bid to end the Senate standoff over President <b>Bush's</b> judicial picks would let five nominees advance to a final vote while preserving the <b>...<b>...</b><S> |
| תג משנה של | R |
| פורמט התוכן | טקסט (HTML) |
| SL_MAIN | |
|---|---|
| הגדרה | התג הזה מכיל את התוכן של תוצאת קידום. משמש לניתוח מבצעים. טקסט העוגן וכתובת ה-URL של קישור הכותרת מופיעים בתגי המשנה T ו-U בהתאמה. השורות של הטקסט ושל הקישורים בגוף מופיעות בתגי המשנה BODY_LINE. |
| תגי משנה | BODY_LINE*, T, U |
| תג משנה של | SL_RESULTS |
| פורמט התוכן | ריק |
| SL_RESULTS | |
|---|---|
| הגדרה | תג כלי קיבול לתוצאות מקודמות. אחד מהם יופיע בכל פעם שיש מבצע בתוצאות החיפוש. תג המשנה SL_MAIN מכיל את נתוני התוצאה העיקריים. |
| תגי משנה | SL_MAIN* |
| תג משנה של | R |
| פורמט התוכן | ריק |
| איות | |
|---|---|
| הגדרה | התג <Spelling> כולל הצעה לתיקון איות חלופי של השאילתה שנשלחה. התג הזה מופיע רק בדף הראשון של תוצאות החיפוש. הצעות לאיות זמינות באנגלית, בסינית, ביפנית ובקוריאנית. הערה: Google תחזיר הצעות לאיות רק לשאילתות שבהן ערך הפרמטר gl הוא באותיות קטנות. |
| דוגמה | <Spelling> |
| תגי משנה | הצעה |
| תג משנה של | GSP |
| פורמט התוכן | ריק |
| הצעה | |||||||
|---|---|---|---|---|---|---|---|
| הגדרה | התג <Suggestion> מכיל הצעה לתיקון איות חלופי של השאילתה שנשלחה. אפשר להשתמש בתוכן של התג כדי להציע למשתמש שביצע את החיפוש את האיות החלופי. הערך של המאפיין q הוא הצעה לאיות שמוצגת בפורמט URL-escaped, שאפשר להשתמש בה כשאילתת חיפוש. | ||||||
| מאפיינים |
|
||||||
| דוגמה | <Suggestion q="soccer"><b><i>soccer</i></b></Suggestion> | ||||||
| תג משנה של | איות | ||||||
| פורמט התוכן | טקסט (HTML) | ||||||
| T | |
|---|---|
| הגדרה | התג <T> מכיל את הכותרת של התוצאה. |
| דוגמה | <T>Amici's East Coast Pizzeria</T> |
| תג משנה של | R |
| פורמט התוכן | טקסט (HTML) |
| title | |
|---|---|
| הגדרה | התג <title> הוא צאצא של <Context> ומכיל את השם של מנוע החיפוש הניתן לתכנות. התג <title> הוא צאצא של התג <Facet>, והוא מספק כותרת לקבוצה של היבטים. |
| דוגמה | כצאצא של <Context>: <title>מנוע החיפוש שלי</title> כצאצא של <Facet>: <title>facet title</title> |
| תג משנה של | Context, Facet |
| פורמט התוכן | טקסט |
| TM | |
|---|---|
| הגדרה | התג <TM> מזהה את סך הזמן בשרת שנדרש להחזרת תוצאות החיפוש, שנמדד בשניות. |
| דוגמה | <TM>0.100445</TM> |
| תג משנה של | GSP |
| פורמט התוכן | טקסט (מספר בשיטת נקודה צפה) |
| TT | |
|---|---|
| הגדרה | התג <TT> מספק טיפ לחיפוש. |
| דוגמה | <TT><i>טיפ: ברוב הדפדפנים, לחיצה על מקש Return מפיקה את אותן תוצאות כמו לחיצה על לחצן החיפוש.</i></TT> |
| תג משנה של | GSP |
| U | |
|---|---|
| הגדרה | התג <U> מספק את כתובת ה-URL של תוצאת החיפוש. |
| דוגמה | <U>http://www.dominos.com/</U> |
| תג משנה של | R |
| פורמט התוכן | טקסט (כתובת URL אבסולוטית) |
| UD | |
|---|---|
| הגדרה | התג <UD> מספק את כתובת ה-URL של תוצאת החיפוש בקידוד IDN (שם דומיין בינלאומי). הערך מאפשר להציג דומיינים בשפות מקומיות. לדוגמה, כתובת URL עם קידוד IDN http://www.%E8%8A%B1%E4%BA%95.com יכולה להיות מפוענחת ומוצגת כ-http://www.花井鮨.com. התג <UD> ייכלל רק בתוצאות חיפוש של בקשות שכללו את הפרמטר ud. הערה: זוהי תכונה בגרסת בטא. |
| דוגמה | <UD>http://www.%E8%8A%B1%E4%BA%95.com/</UD> |
| תג משנה של | R |
| פורמט התוכן | טקסט (כתובת URL מקודדת ב-IDN) |
| UE | |
|---|---|
| הגדרה | התג <UE> מספק את כתובת ה-URL של תוצאת החיפוש. הערך עובר escape בכתובת ה-URL כדי שיתאים להעברה כפרמטר של שאילתה בכתובת URL. |
| דוגמה | <UE>http://www.dominos.com/</UE> |
| תג משנה של | R |
| פורמט התוכן | טקסט (כתובת URL עם תווי escape) |
| XT | |
|---|---|
| הגדרה | התג <XT> מציין שהמספר הכולל המשוער של התוצאות, כפי שצוין בתג M, מייצג למעשה את המספר הכולל המדויק של התוצאות. פרטים נוספים מופיעים בקטע סינון אוטומטי במסמך הזה. |
| דוגמה | <XT /> |
| תג משנה של | RES |
| פורמט התוכן | ריק |
תוצאות XML לשאילתות של חיפוש תמונות
בדוגמה הזו של בקשת תמונה, המערכת מתבקשת להציג 5 תוצאות (num=5) לגבי מונח החיפוש 'קוף' (q=monkey).
http://www.google.com/cse? searchtype=image &num=2 &q=monkey &client=google-csbe &output=xml_no_dtd &cx=00255077836266642015:u-scht7a-8i
הבקשה הזו מחזירה את תוצאת ה-XML שמוצגת בהמשך.
<GSP VER="3.2">
<TM>0.395037</TM>
<Q>monkeys</Q>
<PARAM name="cx" value="011737558837375720776:mbfrjmyam1g" original_value="011737558837375720776:mbfrjmyam1g" url_<escaped_value="011737558837375720776%3Ambfrjmyam1g" js_escaped_value="011737558837375720776:mbfrjmyam1g"/>
<PARAM name="client" value="google-csbe" original_value="google-csbe" url_escaped_value="google-csbe" js_escaped_value="google-csbe"/>
<PARAM name="q" value="monkeys" original_value="monkeys" url_escaped_value="monkeys" js_escaped_value="monkeys"/>
<PARAM name="num" value="2" original_value="2" url_escaped_value="2" js_escaped_value="2"/>
<PARAM name="output" value="xml_no_dtd" original_value="xml_no_dtd" url_escaped_value="xml_no_dtd" js_escaped_value="xml_no_dtd"/>
<PARAM name="adkw" value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" original_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" url_escaped_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" js_escaped_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A"/>
<PARAM name="hl" value="en" original_value="en" url_escaped_value="en" js_escaped_value="en"/>
<PARAM name="oe" value="UTF-8" original_value="UTF-8" url_escaped_value="UTF-8" js_escaped_value="UTF-8"/>
<PARAM name="ie" value="UTF-8" original_value="UTF-8" url_escaped_value="UTF-8" js_escaped_value="UTF-8"/>
<PARAM name="boostcse" value="0" original_value="0" url_escaped_value="0" js_escaped_value="0"/>
<Context>
<title>domestigeek</title>
</Context>
<ARES/>
<RES SN="1" EN="2">
<M>2500000</M>
<NB>
<NU>/images?q=monkeys&num=2&hl=en&client=google-csbe&cx=011737558837375720776:mbfrjmyam1g&boostcse=0&output=xml_no_dtd
&ie=UTF-8&oe=UTF-8&tbm=isch&ei=786oTsLiJaaFiALKrPChBg&start=2&sa=N
</NU>
</NB>
<RG START="1" SIZE="2"/>
<R N="1" MIME="image/jpeg">
<RU>http://www.flickr.com/photos/fncll/135465558/</RU>
<U>
http://farm1.static.flickr.com/46/135465558_123402af8c.jpg
</U>
<UE>
http://farm1.static.flickr.com/46/135465558_123402af8c.jpg
</UE>
<T>Computer <b>Monkeys</b> | Flickr - Photo Sharing!</T>
<RK>0</RK>
<BYLINEDATE>1146034800</BYLINEDATE>
<S>Computer <b>Monkeys</b> | Flickr</S>
<LANG>en</LANG>
<IMG WH="500" HT="305" IID="ANd9GcQARKLwzi-t4lpWi2AERV3kJb4ansaQzTn3MNDZR9fD_JDiktPKByKUBLs">
<SZ>88386</SZ>
<IN/>
</IMG>
<TBN TYPE="0" WH="130" HT="79" URL="http://t0.gstatic.com/images?q=tbn:ANd9GcQARKLwzi-
t4lpWi2AERV3kJb4ansaQzTn3MNDZR9fD_JDiktPKByKUBLs"/>
</R>
<R N="2" MIME="image/jpeg">
<RU>
http://www.flickr.com/photos/flickerbulb/187044366/
</RU>
<U>
http://farm1.static.flickr.com/73/187044366_506a1933f4.jpg
</U>
<UE>
http://farm1.static.flickr.com/73/187044366_506a1933f4.jpg
</UE>
<T>
one. ugly. <b>monkey</b>. | Flickr - Photo Sharing!
</T>
<RK>0</RK>
<BYLINEDATE>1152514800</BYLINEDATE>
<S>one. ugly. <b>monkey</b>.</S>
<LANG>en</LANG>
<IMG WH="400" HT="481" IID="ANd9GcQ3Qom0bYbee4fThCQVi96jMEwMU6IvVf2b8K5vERKVw-
EF4tQQnDDKOq0"><SZ>58339</SZ>
<IN/>
</IMG>
<TBN TYPE="0" WH="107" HT="129" URL="http://t1.gstatic.com/images?q=tbn:ANd9GcQ3Qom0bYbee4fThCQ
Vi96jMEwMU6IvVf2b8K5vERKVw-EF4tQQnDDKOq0"/>
</R>
</RES>
</GSP>חיפוש תמונות: תגי XML
בטבלה שלמטה מוצגים תגי XML נוספים שמשמשים בתגובות XML לשאילתות לחיפוש תמונות.
יכול להיות שסמלים מסוימים יוצגו לצד חלק מתגי המשנה בהגדרות שבהמשך. לפניכם פירוט של הסמלים והמשמעויות שלהם:
* = אפס מופעים או יותר של תג המשנה
+ = מופע אחד או יותר של תג המשנה
| RG | ||||||||||
|---|---|---|---|---|---|---|---|---|---|---|
| הגדרה | התג <RG> כולל את הפרטים של תוצאת חיפוש תמונה ספציפית. |
|||||||||
| מאפיינים |
| |||||||||
| תג משנה של | RES | |||||||||
| RU | |
|---|---|
| הגדרה | התג <RU tag> כולל פרטים של כל תוצאות של חיפוש תמונות. |
| תג משנה של | R |