הפניה לממשק API של XML

הדף הזה מתייחס לגרסת ה-XML של ממשק ה-API של Custom Search JSON, שזמין רק ללקוחות Google Site Search.

  1. סקירה כללית
  2. פורמט הבקשה של Programmable Search Engine
    1. סקירה כללית של הבקשה
    2. תנאי השאילתה
    3. הפרמטרים של הבקשה
      1. שאילתות לדוגמה ב-WebSearch
      2. הגדרות של פרמטרים של שאילתות לחיפוש באינטרנט
      3. חיפוש מתקדם
      4. פרמטרים של שאילתות לחיפוש מתקדם
      5. מונחי שאילתה מיוחדים
      6. שאילתות על תמונה לדוגמה
      7. פרמטרים של שאילתת חיפוש תמונות
      8. מגבלות על בקשות
    4. הפיכת שאילתות והצגת תוצאות לבינלאומיות
      1. קידוד תווים
      2. שפות ממשק
      3. חיפוש בסינית פשוטה ומסורתית
    5. סינון התוצאות
      1. סינון אוטומטי של תוצאות החיפוש
      2. סינון לפי שפה ומדינה
      3. סינון תוכן למבוגרים בלבד באמצעות החיפוש הבטוח
  3. תוצאות XML
    1. DTD של תוצאות Google XML
    2. מידע על תגובת XML
    3. תוצאות XML עבור שאילתות חיפוש רגילות, שאילתות תמונה ושאילתות חיפוש מתקדם
      1. חיפוש רגיל/מתקדם: שאילתה לדוגמה ותוצאת XML
      2. חיפוש רגיל/מתקדם: תגי XML
      3. תוצאות XML לשאילתות חיפוש תמונות
      4. חיפוש תמונות: שאילתה לדוגמה ותוצאת XML
      5. חיפוש תמונות: תגי XML

סקירה כללית

שירות Google WebSearch מאפשר ללקוחות של 'חיפוש באתר' של Google להציג את תוצאות החיפוש של Google באתרי האינטרנט שלהם. שירות WebSearch משתמש בפרוטוקול פשוט מבוסס HTTP כדי להגיש תוצאות חיפוש. לאדמינים של חיפוש יש שליטה מלאה על האופן שבו הם מבקשים תוצאות חיפוש ועל האופן שבו הם מציגים את התוצאות למשתמש הקצה. מסמך זה מתאר את הפרטים הטכניים של בקשת החיפוש ב-Google והפורמטים של התוצאות.

כדי לאחזר את התוצאות של Google WebSearch, האפליקציה שולחת ל-Google בקשת HTTP פשוטה. לאחר מכן Google מחזירה את תוצאות החיפוש בפורמט XML. תוצאות בפורמט XML מאפשרות לך להתאים אישית את האופן שבו תוצאות החיפוש מוצגות.

פורמט בקשה של WebSearch

סקירה כללית של הבקשה

הבקשה של חיפוש Google היא פקודת HTTP GET רגילה. הדוח כולל אוסף של פרמטרים שרלוונטיים לשאילתות שלך. הפרמטרים האלה כלולים בכתובת ה-URL של הבקשה כצמדים של שם=ערך, שמופרדים באמצעות תווי אמפרסנד (&). הפרמטרים כוללים נתונים כמו שאילתת החיפוש ומזהה מנוע ייחודי (cx) שמזהה את המנוע ששולח את בקשת ה-HTTP. שירות WebSearch או Image Search מחזיר תוצאות XML בתגובה לבקשות ה-HTTP שלך.

מונחי השאילתה

רוב בקשות החיפוש כוללות מונח שאילתה אחד או יותר. מונח שאילתה מופיע כערך של פרמטר בבקשת החיפוש.

מונחי שאילתה יכולים לציין כמה סוגי מידע, כדי לסנן ולארגן את תוצאות החיפוש ש-Google מחזירה. שאילתות יכולות לציין את הפרטים הבאים:

  • מילים או ביטויים להכללה או להחרגה
    • כל המילים בשאילתת חיפוש (ברירת מחדל)
    • ביטוי מדויק בשאילתת החיפוש
    • כל מילה או ביטוי בשאילתת חיפוש
  • איפה במסמך יש לחפש את מונחי החיפוש
    • בכל מקום במסמך (ברירת מחדל)
    • רק בגוף המסמך
    • רק בכותרת המסמך
    • רק בכתובת ה-URL של המסמך
    • רק בקישורים במסמך
  • הגבלות על המסמכים עצמם
    • הכללה או החרגה של מסמכים מסוגי קבצים מסוימים (כמו קובצי PDF או מסמכי Word)
  • שאילתות מיוחדות על כתובות URL שמחזירה מידע על כתובת URL נתונה, במקום לבצע חיפוש
    • שאילתות שמחזירות מידע כללי על כתובת URL, כמו הקטגוריה, קטע הקוד או השפה שלה ב-Open Directory
    • שאילתות שמחזירות קבוצת דפי אינטרנט שמקשרים לכתובת URL
    • שאילתות שמחזירות קבוצה של דפי אינטרנט שדומים לכתובת URL נתונה

חיפוש ברירת מחדל

צריך לסמן את כתובת ה-URL בתו בריחה (escape) בערכי הפרמטרים של שאילתות החיפוש. חשוב לזכור שצריך להחליף את סימן הפלוס ("+") בכל רצפי רווחים לבנים בשאילתת החיפוש. נושא זה נדון לעומק בקטע העברה של כתובת אתר להתעלמת כתובת אתר במסמך זה.

מונח שאילתת החיפוש נשלח לשירות WebSearch באמצעות הפרמטר q. דוגמה למונח של שאילתת חיפוש:

q=horses+cows+pigs

כברירת מחדל, שירות Google WebSearch מחזיר רק מסמכים הכוללים את כל המונחים שבשאילתת החיפוש.

הפרמטרים של הבקשה

בקטע הזה מפורטים הפרמטרים שניתן להשתמש בהם לשליחת בקשת חיפוש. הפרמטרים מחולקים לשתי רשימות. הרשימה הראשונה מכילה פרמטרים שרלוונטיים לכל בקשות החיפוש. הרשימה השנייה מכילה פרמטרים שרלוונטיים רק לבקשות של חיפוש מתקדם.

נדרשים שלושה פרמטרים של בקשה:

  • הפרמטר client חייב להיות מוגדר ל-google-csbe
  • הפרמטר output מציין את הפורמט של תוצאות ה-XML שהוחזרו. ניתן להחזיר את התוצאות עם (xml) או בלי (xml_no_dtd) הפניה ל-DTD של Google. מומלץ להגדיר את הערך הזה כ-xml_no_dtd. הערה: אם לא מציינים את הפרמטר הזה, התוצאות יוחזרו ב-HTML במקום ב-XML.
  • הפרמטר cx שמייצג את המזהה הייחודי של המנוע.

הפרמטרים הנפוצים ביותר של בקשות, מלבד אלה שצוינו למעלה, הם:

  • num – המספר המבוקש של תוצאות החיפוש
  • q - מונחי החיפוש
  • start - האינדקס ההתחלתי של התוצאות

שאילתות WebSearch לדוגמה

הדוגמאות הבאות מציגות מספר בקשות HTTP של WebSearch כדי להמחיש את אופן השימוש בפרמטרים שונים של שאילתות. הגדרות לפרמטרים השונים של שאילתות מופיעות בקטעים הגדרות של פרמטרים של שאילתות ב-WebSearch ופרמטרים של שאילתות חיפוש מתקדם במסמך זה.

הבקשה הזו מבקשת את 10 התוצאות הראשונות (start=0&num=10) עבור מונח השאילתה "red sox" (q=red+sox). השאילתה מציינת גם שהתוצאות צריכות להגיע מאתרי אינטרנט קנדיים (cr=countryCA) ושהן צריכות להיכתב בצרפתית (lr=lang_fr). לבסוף, השאילתה מציינת ערכים לפרמטרים client, output, ו-cx, ושלושת התוצאות האלה נדרשים.

http://www.google.com/search?
start=0
&num=10
&q=red+sox
&cr=countryCA
&lr=lang_fr
&client=google-csbe
&output=xml_no_dtd
&cx=00255077836266642015:u-scht7a-8i

בדוגמה הזו נעשה שימוש בחלק מהפרמטרים של שאילתות החיפוש המתקדם כדי להתאים אישית אף יותר את שאילתת החיפוש. בבקשה הזו נעשה שימוש בפרמטר as_q (as_q=red+sox) במקום בפרמטר q. המערכת משתמשת גם בפרמטר as_eq כדי להחריג מסמכים שמכילים את המילה "Yankees" מתוצאות החיפוש (as_eq=yankees).

http://www.google.com/search?
start=0
&num=10
&as_q=red+sox
&as_eq=Yankees
&client=google-csbe
&output=xml_no_dtd
&cx=00255077836266642015:u-scht7a-8i

הגדרות פרמטר שאילתה של WebSearch

c2coff
תיאור

אופציונלי. הפרמטר c2coff מפעיל או משבית את התכונה חיפוש בסינית פשוטה ומסורתית.

ערך ברירת המחדל של הפרמטר הזה הוא 0 (אפס), כלומר התכונה מופעלת. ערכי הפרמטר c2coff הם:

Value פעולה
1 מושבתת
0 מופעל
דוגמאות q=google&c2coff=1

לקוח
תיאור

נדרש. הפרמטר client חייב להיות מוגדר לערך google-csbe.

דוגמאות q=google&client=google-csbe

cr
תיאור

אופציונלי. הפרמטר cr מגביל את תוצאות החיפוש למסמכים שמקורם במדינה מסוימת. אפשר להשתמש באופרטורים בוליאניים בערך הפרמטר cr.

המערכת של Google WebSearch קובעת את המדינה של מסמך באמצעות ניתוח של:

  • הדומיין ברמה העליונה (TLD) של כתובת ה-URL של המסמך
  • המיקום הגיאוגרפי של כתובת ה-IP של שרת האינטרנט

בקטע Country (cr) Parameter values מופיעה רשימה של ערכים חוקיים לפרמטר הזה.

דוגמאות q=Frodo&cr=countryNZ

cx
תיאור

נדרש. הפרמטר cx מציין קוד ייחודי שמזהה מנוע חיפוש מותאם אישית. כדי לאחזר תוצאות חיפוש מאותו מנוע, צריך לציין Programmable Search Engine באמצעות הפרמטר cx.

כדי למצוא את הערך של הפרמטר cx, עוברים אל 'לוח הבקרה' > הכרטיסייה 'קודים' במנוע שלכם ושם אפשר למצוא אותו באזור הטקסט, בקטע 'הדבקה של קוד זה בדף שבו רוצים שתיבת החיפוש תופיע. תוצאות החיפוש יוצגו בדף באירוח של Google.'

דוגמאות q=Frodo&cx=00255077836266642015:u-scht7a-8i

סינון
תיאור

אופציונלי. הפרמטר filter מפעיל או משבית את הסינון האוטומטי של תוצאות החיפוש ב-Google. אפשר לקרוא מידע נוסף על המסננים של תוצאות החיפוש של Google בקטע סינון אוטומטי במסמך הזה.

ערך ברירת המחדל של הפרמטר filter הוא 1, כדי לציין שהתכונה מופעלת. הערכים החוקיים לפרמטר הזה הם:

Value פעולה
1 מושבתת
0 מופעל

הערה: כברירת מחדל, Google מחילה סינון על כל תוצאות החיפוש כדי לשפר את האיכות של התוצאות האלה.

דוגמאות q=google&filter=0

gl
תיאור

אופציונלי. ערך הפרמטר gl הוא קוד מדינה בן שתי אותיות. בתוצאות WebSearch, הפרמטר gl מגדיל את תוצאות החיפוש שמדינת המקור שלהן תואמת לערך הפרמטר. כדי לקבל רשימה של ערכים חוקיים, אפשר לעיין בקטע קודי מדינות.

ציון ערך פרמטר gl בבקשות WebSearch אמור לשפר את הרלוונטיות של התוצאות. המצב הזה נכון במיוחד ללקוחות בינלאומיים, ובאופן ספציפי יותר ללקוחות במדינות דוברות אנגלית מחוץ לארה"ב.

דוגמאות

הבקשה הזו מרחיבה את היקף המסמכים שנכתבו בבריטניה בתוצאות של WebSearch:
q=pizza&gl=uk


hl
תיאור

אופציונלי. הפרמטר hl מציין את שפת הממשק (שפת המארח) של ממשק המשתמש. כדי לשפר את הביצועים ואת האיכות של תוצאות החיפוש, מומלץ מאוד להגדיר את הפרמטר הזה באופן מפורש.

לקבלת מידע נוסף, עיינו בקטע שפות הממשק במאמר Internationalizing שאילתות והצגת תוצאות. לקבלת מידע נוסף, ניתן לעיין בשפות ממשק נתמכות לקבלת רשימה של שפות נתמכות.

דוגמאות

בקשה זו מטרגטת מודעות ליין בצרפתית. (Vin הוא המונח בצרפת ליין).

q=vin&ip=10.10.10.10&ad=w5&hl=fr

hq
תיאור

אופציונלי. הפרמטר hq מצרף את מונחי השאילתה שצוינו לשאילתה, כאילו הם שולבו עם אופרטור AND לוגי.

דוגמאות

בקשה זו מחפשת גם 'פיצה' וגם 'גבינה'. הביטוי זהה ל-q=pizza+cheese.

q=pizza&hq=cheese


ie
תיאור

אופציונלי. הפרמטר ie מגדיר את סכמת קידוד התווים שיש להשתמש בה כדי לפרש את מחרוזת השאילתה. ערך ברירת המחדל של ie הוא latin1.

עיין בקטע קידוד תווים לדיון לגבי המקרים שבהם ייתכן שיהיה צורך להשתמש בפרמטר זה.

בקטע סכימות קידוד תווים מוצגת רשימה של ערכי ie אפשריים.

דוגמאות q=google&ie=utf8&oe=utf8
lr
תיאור

אופציונלי. הפרמטר lr (הגבלת שפה) מגביל את תוצאות החיפוש למסמכים שכתובים בשפה מסוימת.

מערכת Google WebSearch קובעת את השפה של מסמך באמצעות הניתוח של:

  • הדומיין ברמה העליונה (TLD) של כתובת ה-URL של המסמך
  • מטא תגים של שפה בתוך המסמך
  • השפה הראשית שבה כתוב הטקסט במסמך
  • שפות משניות, אם יש, שמופיעות בגוף הטקסט של המסמך

בקטע שפה (lr) ערכי אוסף מופיעה רשימה של הערכים החוקיים לפרמטר הזה.

דוגמאות q=Frodo&lr=lang_en

num
תיאור

אופציונלי. הפרמטר num מזהה את מספר תוצאות החיפוש שיש להחזיר.

ערך ברירת המחדל של num הוא 10, והערך המקסימלי הוא 20. אם מבקשים יותר מ-20 תוצאות, יוחזרו רק 20 תוצאות.

הערה: אם המספר הכולל של תוצאות החיפוש נמוך ממספר התוצאות המבוקש, יוחזרו כל תוצאות החיפוש הזמינות.

דוגמאות q=google&num=10

oe
תיאור

אופציונלי. הפרמטר oe מגדיר את סכמת קידוד התווים שבה יש להשתמש כדי לפענח את תוצאת ה-XML. ערך ברירת המחדל של oe הוא latin1.

עיין בקטע קידוד תווים לדיון לגבי המקרים שבהם ייתכן שיהיה צורך להשתמש בפרמטר זה.

בקטע סכימות קידוד תווים מוצגת רשימה של ערכי oe אפשריים.

דוגמאות q=google&ie=utf8&oe=utf8

output
תיאור

נדרש. הפרמטר output מציין את הפורמט של תוצאות ה-XML. הערכים החוקיים היחידים לפרמטר הזה הם xml ו-xml_no_dtd. בתרשים הבא מוסברים ההבדלים בין ערכי הפרמטרים האלה.

Value תצורת עיצוב
xml_no_dtd תוצאות ה-XML לא יכללו הצהרת DOCTYPE. (מומלץ)
xml תוצאות ה-XML יכילו הפניה של Google ל-DTD. השורה השנייה של התוצאה תזהה את הסוג של הגדרת המסמך (DTD) שבו נעשה שימוש בתוצאות:
    <!DOCTYPE GSP SYSTEM "google.dtd">
דוגמאות output=xml_no_dtd
output=xml

q
תיאור

אופציונלי. הפרמטר q מציין את שאילתת החיפוש שמשתמש הזין. אף על פי שהפרמטר הזה הוא אופציונלי, צריך לציין ערך עבור לפחות אחד מהפרמטרים של השאילתה (as_epq, as_lq, as_oq, as_q כדי לקבל תוצאות חיפוש.

יש גם כמה מונחי שאילתה מיוחדים שאפשר להשתמש בהם כחלק מערך הפרמטר q. רשימה והגדרות של המונחים האלה מופיעה בקטע מונחי שאילתה מיוחדים.

לוח הבקרה של חיפוש Google כולל דוח של השאילתות המובילות שנשלחו באמצעות הפרמטר q.

הערה: הערך שמצוין לפרמטר q חייב להיות מסומן בתו בריחה (escape) של כתובת URL.

דוגמאות q=vacation&as_oq=london+paris

בטיחות
תיאור

אופציונלי. הפרמטר safe מציין איך יש לסנן את תוצאות החיפוש להצגת תוכן למבוגרים בלבד ותוכן פורנוגרפי. ערך ברירת המחדל של הפרמטר safe הוא off. ערכי הפרמטרים החוקיים הם:

Value פעולה
off השבתת החיפוש הבטוח
medium הפעלת החיפוש הבטוח
high הפעלת גרסה מחמירה יותר של החיפוש הבטוח

מידע נוסף על התכונה הזו זמין בקטע סינון תוכן למבוגרים בלבד באמצעות חיפוש בטוח.

דוגמאות q=adult&safe=high

התחלה
תיאור

אופציונלי. הפרמטר start מציין את התוצאה התואמת הראשונה שאמורה להיכלל בתוצאות החיפוש. הפרמטר start משתמש באינדקס שמבוסס על אפס. כלומר, התוצאה הראשונה היא 0, התוצאה השנייה היא 1 וכן הלאה.

הפרמטר start פועל יחד עם הפרמטר num כדי לקבוע אילו תוצאות חיפוש יוחזרו. שים לב שלא יוחזרו יותר מ-1,000 תוצאות עבור כל שאילתה, גם אם יותר מ-1,000 מסמכים תואמים לשאילתה, ולכן הגדרה של '1000 ומעלה' לא תניב תוצאות.

דוגמאות start=10

מיון
תיאור

אופציונלי. הפרמטר sort מציין שהתוצאות ימוינו לפי הביטוי שצוין. לדוגמה, אפשר למיין לפי תאריך.

דוגמאות

sort=date


U
תיאור

אופציונלי. הפרמטר ud מציין אם תגובת ה-XML צריכה לכלול את כתובת ה-URL בקידוד IDN עבור תוצאת החיפוש. קידוד IDN (International Domain Name) מאפשר הצגת דומיינים באמצעות שפות מקומיות, לדוגמה:

http://www.花井鮨.com

הערכים החוקיים לפרמטר הזה הם 1 (ברירת המחדל). כלומר, תוצאת ה-XML צריכה לכלול כתובות URL בקידוד IDN, ו-0. כלומר, תוצאת ה-XML לא תכלול כתובות URL בקידוד IDN. אם הפרמטר ud מוגדר לערך 1, כתובת ה-URL שמקודדת ב-IDN תופיע בתג UD בתוצאות ה-XML.

אם הפרמטר ud מוגדר ל-0, כתובת ה-URL בדוגמה שלמעלה תוצג כך:

http://www.xn--elq438j.com.

הערה: זוהי תכונת בטא.

דוגמאות q=google&ud=1

הפרמטרים הנוספים של השאילתות שמפורטים מתחת לתמונה רלוונטיים לשאילתות של חיפוש מתקדם. כששולחים חיפוש מתקדם, כל הערכים של מספר פרמטרים (למשל as_eq, as_epq, as_oq וכו') משוקללים במונחי השאילתה עבור אותו חיפוש. בתמונה מוצג הדף 'חיפוש מתקדם' של Google. בתמונה, השם של כל פרמטר של חיפוש מתקדם כתוב בטקסט red בתוך השדה בדף שאליו הפרמטר הזה תואם או לידו.



פרמטרים של שאילתות לחיפוש מתקדם

as_dt
תיאור

אופציונלי. הפרמטר as_dt קובע אם לכלול או להחריג תוצאות מהאתר ששמו צוין בפרמטר as_sitesearch. הערכים i ו-e מציינים הכללה והחרגה בהתאמה.

דוגמאות as_dt=i,as_dt=e

as_epq
תיאור

אופציונלי. הפרמטר as_epq מזהה ביטוי שכל המסמכים בתוצאות החיפוש חייבים להכיל. אפשר גם להשתמש במונח השאילתה של החיפוש באמצעות ביטוי כדי לחפש ביטוי.

דוגמאות as_epq=abraham+lincoln

as_eq
תיאור

אופציונלי. הפרמטר as_eq מזהה מילה או ביטוי שלא אמורים להופיע באף מסמך בתוצאות החיפוש. ניתן גם להשתמש במונח השאילתה Exclude כדי להבטיח שמילה או ביטוי מסוימים לא יופיעו במסמכים בקבוצה של תוצאות חיפוש.

דוגמאות

q=bass&as_eq=music.


as_lq
תיאור

אופציונלי. הפרמטר as_lq מציין שכל תוצאות החיפוש צריכות להכיל קישור לכתובת URL מסוימת. אפשר גם להשתמש במונח השאילתה link: בסוג השאילתה הזה.

דוגמאות

as_lq=www.google.com


as_nlo
תיאור

אופציונלי. הפרמטר as_nlo מציין את הערך ההתחלתי של טווח חיפוש. אפשר להשתמש ב-as_nlo וב-as_nhi כדי לצרף לשאילתה טווח חיפוש כולל של as_nlo...as_nhi.

דוגמאות

בטבלה הבאה מוגדר טווח חיפוש של 5 עד 10, כולל:

as_nlo=5&as_nhi=10

as_nhi
תיאור

אופציונלי. הפרמטר as_nhi מציין את ערך הסיום של טווח החיפוש. אפשר להשתמש ב-as_nlo וב-as_nhi כדי לצרף לשאילתה טווח חיפוש כולל של as_nlo...as_nhi.

דוגמאות

בטבלה הבאה מוגדר טווח חיפוש של 5 עד 10, כולל:

as_nlo=5&as_nhi=10

as_oq
תיאור

אופציונלי. הפרמטר as_oq מספק מונחי חיפוש נוספים לבדיקה במסמך. כל מסמך בתוצאות החיפוש חייב להכיל לפחות אחד ממונחי החיפוש הנוספים. אפשר גם להשתמש במונח השאילתה בוליאני OR בסוג השאילתה הזה.

דוגמאות

q=vacation&as_oq=London+Paris


as_q
תיאור

אופציונלי. הפרמטר as_q מספק מונחי חיפוש לבדיקה במסמך. הפרמטר הזה משמש בדרך כלל גם כדי לאפשר למשתמשים לציין מונחים נוספים לחיפוש בתוך קבוצה של תוצאות חיפוש.

דוגמאות

q=president&as_q=John+Adams


as_qdr
תיאור

אופציונלי. הפרמטר as_qdr מבקש תוצאות חיפוש מתקופה מסוימת (טווח תאריכים מהיר). יש תמיכה בערכים הבאים:

התקבלה בקשה מ-d[number] לתוצאות ממספר הימים האחרונים שצוין.
w[number] מבקש תוצאות ממספר השבועות האחרונים שצוין.
m[number] מבקש תוצאות ממספר החודשים האחרונים שצוין.
y[number] מבקש תוצאות ממספר השנים האחרונות שצוין.

דוגמאות

בדוגמה הזו מוצגות בקשות מהשנה האחרונה:

as_qdr=y

בדוגמה הזו מוצגות בקשות מ-10 הימים האחרונים:

as_qdr=d10

as_sitesearch
תיאור

אופציונלי. הפרמטר as_sitesearch מאפשר לציין שכל תוצאות החיפוש צריכות להיות דפים מאתר נתון. כשמגדירים את הפרמטר as_dt, אפשר להשתמש בו גם כדי להחריג דפים מאתר נתון מתוצאות החיפוש.

דוגמאות

q=vacation&as_sitesearch=www.google.com


מונחי שאילתה מיוחדים

Google WebSearch מאפשר להשתמש במספר מונחי שאילתה מיוחדים, המעניקים גישה ליכולות נוספות של מנוע החיפוש של Google. התנאים של השאילתות המיוחדות צריכים להיכלל בערך של פרמטר הבקשה q. כמו בכל מונחי שאילתה אחרים, צריך לסמן את מונחי השאילתה המיוחדים באמצעות URL-escape. מספר של מונחי השאילתה המיוחדים כוללים נקודתיים (:). צריך לסמן את התו הזה גם בתו בריחה (escape) של כתובת URL. הערך של תו בריחה (escape) של כתובת ה-URL הוא %3A.

קישורים אחוריים [link:]
תיאור

מונח השאילתה link: מאחזר את קבוצת דפי האינטרנט שמקושרים לכתובת URL מסוימת. שאילתת החיפוש צריכה להיות בפורמט link:URL, ללא רווח בין מונח השאילתה link: לכתובת ה-URL.

הגרסה של link: לסימון בתו בריחה (escape) היא link%3A.

אפשר גם להשתמש בפרמטר הבקשה as_lq כדי לשלוח בקשת link:.

הערה: לא ניתן לציין מונחי שאילתה אחרים כשמשתמשים ב-link:.

דוגמאות

http://www.google.com/search?q=link%3Awww.example.com


ערך בוליאני OR חיפוש [ OR ]
תיאור

מונח השאילתה OR מאחזר מסמכים שכוללים אחד מתוך סדרה של (שניים או יותר) מונחי שאילתה. כדי להשתמש במונח השאילתה OR, צריך להוסיף את מונח החיפוש OR באותיות גדולות בין המונחים בסדרה.

אפשר גם להשתמש בפרמטר הבקשה as_oq כדי לחפש מונח מתוך קבוצת מונחים.

הערה: אם בבקשת חיפוש מציינים את השאילתה "לונדון+OR+פריז", תוצאות החיפוש יכללו מסמכים שמכילים לפחות אחת משתי המילים האלה. במקרים מסוימים, מסמכים בתוצאות החיפוש עשויים להכיל את שתי המילים.

דוגמאות

חיפוש לונדון או פריז:

קלט של משתמשים:london OR paris מונח השאילתה:q=london+OR+paris

מחפשים 'חופשה' ו'לונדון' או 'פריז':

מונח השאילתה:q=vacation+london+OR+paris

חפש 'חופשה' ואחד מ'לונדון', 'פריז' או 'שוקולד':

מונח השאילתה:  q=vacation+london+OR+paris+OR+chocolates

מחפשים המונח 'חופשה' ו'שוקולדים' או 'לונדון' או 'פריז', כשנותנים את המשקל הנמוך ביותר לשוקולד:

מונח השאילתה:  q=vacation+london+OR+paris+chocolates

חיפוש המונח 'חופשה', 'שוקולדים' ו'פרחים' במסמכים שכוללים גם את לונדון או פריז:

מונח השאילתה:  q=vacation+london+OR+paris+chocolates+flowers

מחפשים 'חופשה' ואחד מ'לונדון' או 'פריז', וגם מחפשים 'שוקולד' או 'פרחים':

מונח השאילתה:  q=vacation+london+OR+paris+chocolates+OR+flowers

החרגת מונח השאילתה [-]
תיאור

מונח שאילתת ההחרגה (-) מגביל את התוצאות של בקשת חיפוש מסוימת למסמכים שלא מכילים מילה או ביטוי מסוימים. כדי להשתמש במונח של שאילתת ההחרגה, צריך להוסיף "-" (סימן חיסור) למילה או לביטוי שלא ייכללו במסמכים התואמים.

הגרסה של - לסימון בתו בריחה (escape) היא %2D.

מונח שאילתת ההחרגה שימושי כאשר למונח חיפוש יש יותר ממשמעות אחת. לדוגמה, המילה "בס" יכולה להחזיר תוצאות לגבי דג או מוזיקה. אם חיפשת מסמכים על דגים, יכול להיות שהיית רוצה להחריג מתוצאות החיפוש מסמכים שקשורים למוזיקה באמצעות מונח שאילתת ההחרגה.

אפשר גם להשתמש בפרמטר הבקשה as_eq כדי להחריג מתוצאות החיפוש מסמכים שתואמים למילה או לביטוי מסוימים.

דוגמאות קלט של משתמשים: bass -music
מונח שאילתה: q=bass+%2Dmusic

אי-הכללה של סוגי קבצים [ -filetype: ]
תיאור

מונח השאילתה -filetype: לא כולל בתוצאות החיפוש מסמכים בעלי סיומת קובץ מסוימת, כמו ".pdf" או ".doc". שאילתת החיפוש צריכה להיות בפורמט -filetype:EXTENSION, ללא רווח בין מונח השאילתה -filetype: לבין התוסף שצוין.

הגרסה של -filetype: לסימון בתו בריחה (escape) היא %2Dfiletype%3A.

הערה: אפשר להחריג כמה סוגי קבצים מתוצאות החיפוש על ידי הוספת עוד מונחי שאילתה מסוג -filetype: לשאילתה. שאילתת החיפוש צריכה לכלול מונח שאילתה אחד מסוג -filetype: לכל סיומת קובץ, שאמורה להיות מוחרגת מתוצאות החיפוש.

סוגי הקבצים הנתמכים על ידי Google הם:

  • Adobe Portable Document Format (pdf)
  • Adobe PostScript (ps)
  • טוס 1-2-3 (wk1, wk2, wk3, wk4, wk5, wki, wks, wku)
  • TechSoup WordPro (lwp)
  • Macwrite (mw)
  • Microsoft Excel (xls)
  • Microsoft PowerPoint (ppt)
  • Microsoft Word (doc)
  • Microsoft Works (שבועים, wps, wdb)
  • Microsoft Write (כתיבה)
  • פורמט טקסט עשיר (rtf)
  • Shockwave Flash (swf)
  • טקסט (ans, txt).

אפשר להוסיף סוגי קבצים נוספים בעתיד. תמיד אפשר למצוא רשימה עדכנית בשאלות הנפוצות בנושא סוגי הקבצים של Google.

דוגמאות

בדוגמה הבאה ניתן לראות מסמכים עם המילה "Google" אך אינם מסמכי PDF:
q=Google+%2Dfiletype%3Apdf

בדוגמה הזו מוצגים מסמכים עם המילה "Google" אבל לא כוללים מסמכי PDF ו-Words:
q=Google+%2Dfiletype%3Apdf+%2Dfiletype%3Adoc


סינון סוגי קבצים [ filetype: ]
תיאור

מונח השאילתה filetype: מגביל את תוצאות החיפוש למסמכים עם סיומת קובץ מסוימת, כמו 'pdf.' או 'doc.'. שאילתת החיפוש צריכה להיות בפורמט filetype:extension, ללא רווח בין מונח השאילתה filetype: לבין התוסף שצוין.

הגרסה של filetype: לסימון בתו בריחה (escape) היא filetype%3A.

ניתן להגביל את תוצאות החיפוש למסמכים שתואמים לאחד מסיומות הקבצים אחת על ידי הוספת עוד מונחי שאילתה מסוג filetype: לשאילתה. שאילתת החיפוש צריכה לכלול מונח שאילתה אחד מסוג filetype: לכל סיומת קובץ שאמורה להיכלל בתוצאות החיפוש. אם יש כמה מונחים בשאילתה filetype:, צריך להפריד ביניהם באמצעות מונח השאילתה OR.

כברירת מחדל, תוצאות החיפוש יכללו מסמכים עם סיומות קבצים כלשהן.

סוגי הקבצים הנתמכים על ידי Google הם:

  • Adobe Portable Document Format (pdf)
  • Adobe PostScript (ps)
  • טוס 1-2-3 (wk1, wk2, wk3, wk4, wk5, wki, wks, wku)
  • TechSoup WordPro (lwp)
  • Macwrite (mw)
  • Microsoft Excel (xls)
  • Microsoft PowerPoint (ppt)
  • Microsoft Word (doc)
  • Microsoft Works (שבועים, wps, wdb)
  • Microsoft Write (כתיבה)
  • פורמט טקסט עשיר (rtf)
  • Shockwave Flash (swf)
  • טקסט (ans, txt).

אפשר להוסיף סוגי קבצים נוספים בעתיד. תמיד אפשר למצוא רשימה עדכנית בשאלות הנפוצות בנושא סוגי הקבצים של Google.

דוגמאות

בדוגמה הזו מוחזרות מסמכי PDF שבהם מוזכרת המילה "Google":
q=Google+filetype%3Apdf

הדוגמה הזו מחזירה מסמכי PDF ו-Word שבהם מוזכר "Google":
q=Google+filetype%3Apdf+OR+filetype%3Adoc


הכללת מונח שאילתה [+]
תיאור

מונח השאילתה Include (+) מציין שמילה או ביטוי חייבים להופיע בכל המסמכים שנכללים בתוצאות החיפוש. כדי להשתמש במונח של שאילתת החיפוש, עליך להוסיף '+' (סימן פלוס) לפני המילה או הביטוי שחייבים להיכלל בכל תוצאות החיפוש.

הגרסה של + עם תו בריחה (escape) של כתובת ה-URL (סימן פלוס) היא %2B.

יש להשתמש ב-+ לפני מילה נפוצה ש-Google בדרך כלל מוחקת לפני זיהוי תוצאות החיפוש.

דוגמאות קלט של משתמשים: Star Wars Episode +I
מונח שאילתה: q=Star+Wars+Episode+%2BI

קישורים בלבד חיפוש, כל המונחים [ allinlinks: ]
תיאור

מונח השאילתה allinlinks: מחייב שמסמכים בתוצאות החיפוש יכללו את כל המילים שבשאילתת החיפוש בקישורים של כתובות אתרים. שאילתת החיפוש צריכה להיות בפורמט allinlinks: ואחריה המילים שבשאילתת החיפוש.

אם שאילתת החיפוש שלך כוללת את מונח השאילתה allinlinks:, Google תבדוק רק את קישורי כתובות ה-URL במסמכים רק עבור המילים בשאילתת החיפוש שלך, תוך התעלמות מטקסטים אחרים במסמכים, מכותרות המסמכים וכתובות ה-URL של כל מסמך. שימו לב שכתובת ה-URL של המסמך שונה מכתובות ה-URL שמצוינות במסמך.

הגרסה של allinlinks: לסימון בתו בריחה (escape) היא allinlinks%3A.

דוגמאות קלט של משתמשים:allinlinks: Google search
מונח שאילתה:q=allinlinks%3A+Google+search

חיפוש ביטוי
תיאור

מונח השאילתה 'חיפוש לביטוי' (") מאפשר לך לחפש ביטויים שלמים על ידי תחימה של הביטויים במירכאות או על ידי חיבורם במקפים.

הגרסה של " (מירכאות) מסומנת בתו בריחה (escape) היא %22.

חיפושי ביטויים שימושיים במיוחד אם אתה מחפש ציטוטים מפורסמים או שמות עצם פרטיים.

אפשר גם להשתמש בפרמטר הבקשה as_epq כדי לשלוח חיפוש לביטוי.

דוגמאות קלט של משתמשים:"Abraham Lincoln"
מונח שאילתה: q=%22Abraham+Lincoln%22

חיפוש טקסט בלבד, כל המונחים [allintext:]
תיאור

מונח השאילתה allintext: מחייב שכל מסמך בתוצאות החיפוש יכלול את כל המילים שבשאילתת החיפוש בגוף המסמך. השאילתה צריכה להיות בפורמט allintext: ואחריה המילים בשאילתת החיפוש.

אם שאילתת החיפוש שלך כוללת את מונח השאילתה allintext:, Google תבדוק רק את גוף המסמכים עבור המילים שבשאילתת החיפוש שלך תוך התעלמות מקישורים במסמכים אלה, מכותרות המסמכים וכתובות ה-URL של המסמכים.

הגרסה של allintext: לסימון בתו בריחה (escape) היא allintext%3A.

דוגמאות בדוגמה הזו, המילים "Google" ו-"search" חייבות להופיע בגוף של כל המסמכים שכלולים בתוצאות החיפוש:
קלט של משתמש:allintext:Google search
מונח השאילתה:q=allintext%3AGoogle+search

חיפוש כותרת, מונח יחיד [intitle:]
תיאור

מונח השאילתה intitle: מגביל את תוצאות החיפוש למסמכים שהכותרת שלהם מכילה מילה מסוימת. שאילתת החיפוש צריכה להיות בפורמט intitle:WORD ללא רווח בין מונח השאילתה intitle: למילה הבאה.

הערה: ניתן לציין יותר ממילה אחת שחייבת להיכלל בכותרת המסמך. לשם כך, יש להוסיף את מונח השאילתה intitle: לפני כל מילה כזאת. ניתן גם להשתמש במונח השאילתה allintitle: כדי לציין שכל מילות השאילתה חייבות להיכלל בכותרות של מסמכים שמופיעים בתוצאות החיפוש.

הגרסה של intitle: לסימון בתו בריחה (escape) היא intitle%3A.

דוגמאות

בדוגמה הזו, המילה "Google" חייבת להופיע בכותרות של כל המסמכים בתוצאות החיפוש, והמילה "search" חייבת להופיע במקום כלשהו בכותרות, בכתובות ה-URL, בקישורים או בגוף הטקסט של המסמכים האלה:
קלט של המשתמש:intitle:Google search
מונח השאילתה:q=intitle%3AGoogle+search


Title Search, כל המונחים [allintitle:]
תיאור

מונח השאילתה allintitle: מגביל את תוצאות החיפוש למסמכים שמכילים את כל מילות השאילתה בכותרת המסמך. כדי להשתמש במונח השאילתה allintitle:, צריך לכלול את המחרוזת "allintitle:" בתחילת שאילתת החיפוש.

הערה: הוספת allintitle: בתחילת שאילתת חיפוש מקבילה להוספת intitle:לפני כל מילה בשאילתת החיפוש.

הגרסה של allintitle: עם בתו בריחה (escape) את כתובת ה-URL היא allintitle%3A.

דוגמאות

בדוגמה הזו, המילים "Google" ו-"search" חייבות להופיע בכותרות של מסמכים בתוצאות החיפוש:
קלט מהמשתמש: allintitle: Google search
מונח השאילתה: q=allintitle%3A+Google+search


חיפוש כתובת אתר, מונח יחיד [inurl:]
תיאור

מונח השאילתה inurl: מגביל את תוצאות החיפוש למסמכים שמכילים מילה מסוימת בכתובת ה-URL של המסמך. שאילתת החיפוש צריכה להיות בפורמט inurl:WORD ללא רווח בין מונח השאילתה inurl: למילה הבאה.

מונח השאילתה inurl: מתעלם מסימני פיסוק ומשתמש רק במילה הראשונה אחרי האופרטור inurl:. ניתן לציין יותר ממילה אחת שחייבת להיכלל בכתובת ה-URL של המסמך, על ידי הוספת מונח השאילתה inurl: לפני כל מילה כזאת. ניתן גם להשתמש במונח השאילתה allinurl: כדי לציין שכל מילות השאילתה חייבות להיכלל בכתובות ה-URL של מסמכים שמופיעים בתוצאות החיפוש.

הגרסה של inurl: לסימון בתו בריחה (escape) היא inurl%3A.

דוגמאות

בדוגמה הזו, המילה "Google" חייבת להופיע בכתובות ה-URL של כל המסמכים בתוצאות החיפוש, והמילה "search" חייבת להופיע במקום כלשהו בכותרות, בכתובות ה-URL, בקישורים או בגוף הטקסט של המסמכים האלה:
קלט של המשתמש: inurl:Google search
מונח השאילתה: q=inurl%3AGoogle+search


URL Search, כל המונחים [allinurl:]
תיאור

מונח השאילתה allinurl: מגביל את תוצאות החיפוש למסמכים שמכילים את כל מילות השאילתה בכתובת ה-URL של המסמך. כדי להשתמש במונח השאילתה allinurl:, צריך לכלול את המחרוזת allinurl: בתחילת שאילתת החיפוש.

מונח השאילתה allinurl: מתעלם מסימני פיסוק, ולכן הוא פועל רק במילים ולא ברכיבי כתובות URL. לדוגמה, allinurl: uk/scotland יגביל את התוצאות למסמכים שבכתובות ה-URL שלהם מכילים את המילים "uk" ו-"scotland", אך לא יחייב ששתי המילים האלה יופיעו בסדר כלשהו או הפרדה באמצעות קו נטוי.

הגרסה של allinurl: לסימון בתו בריחה (escape) היא allinurl%3A.

דוגמאות

בדוגמה הזו מצוין שהמילים Google ו-search חייבות להופיע בכתובות ה-URL של המסמכים בתוצאות החיפוש:
קלט מהמשתמש: allinurl: Google search
מונח השאילתה: q=allinurl%3A+Google+search



פרטי מסמך אינטרנט [info:]
תיאור

מונח השאילתה info: מאחזר מידע כללי על כתובת URL כל עוד כתובת ה-URL הזו כלולה באינדקס החיפוש של Google. שאילתת החיפוש צריכה להיות בפורמט info:URL, ללא רווח בין מונח השאילתה info: לכתובת ה-URL.

הגרסה של info: עם בתו בריחה (escape) היא info%3A.

הערה: לא ניתן לציין מונחי שאילתה אחרים כשמשתמשים ב-info:.

דוגמאות קלט של משתמשים: info:www.google.com
מונח שאילתה: q=info%3Awww.google.com

שאילתות על תמונות לדוגמה

הדוגמאות הבאות מציגות שתי בקשות HTTP לתמונות כדי להמחיש את השימוש בפרמטרים שונים של שאילתה. הגדרות לפרמטרים השונים של השאילתה מופיעות בקטעים 'הגדרות של פרמטרים של שאילתות תמונה' במסמך זה.

הבקשה הזו מבקשת את 5 התוצאות הראשונות (start=0&num=5) עבור מונח השאילתה "קוף" (q=monkey), מסוג filetype .png. לבסוף, השאילתה מציינת ערכים עבור הפרמטרים client, output ו-cx, וכל שלושת הפרמטרים נדרשים.

http://www.google.com/cse?
  searchtype=image
  start=0
  &num=5
  &q=monkey
  &as_filetype=png
  &client=google-csbe
  &output=xml_no_dtd
  &cx=00255077836266642015:u-scht7a-8i

פרמטרים של שאילתות לחיפוש תמונות

as_filetype
תיאור

אופציונלי. מחזירה תמונות מסוג שצוין. הערכים המותרים הם: bmp, gif, png, jpg ו-svg.

דוגמאות q=google&as_filetype=png

imgsz, imgsz
תיאור

אופציונלי. מחזירה תמונות בגודל שצוין, כאשר הגודל יכול להיות אחד מהבאים:

  • icon (קטן)
  • small|medium|large|xlarge (בינונית)
  • xxlarge (גדול)
  • huge (גדול במיוחד)

דוגמאות q=google&as_filetype=png&imgsz=icon

imgtype
תיאור

אופציונלי. הפונקציה מחזירה תמונות מסוג, שיכול להיות אחת מהאפשרויות הבאות:

  • clipart (קליפ)
  • face (פנים)
  • lineart (לינארית)
  • news (חדשות)
  • photo (תמונה)

דוגמאות q=google&as_filetype=png&imgtype=photo

imgc, imgc
תיאור

אופציונלי. הצגת תמונות בשחור-לבן, תמונות בגווני אפור או תמונות צבעוניות:

  • mono (שחור ולבן)
  • gray (גווני אפור)
  • color (צבע)

דוגמאות q=google&as_filetype=png&imgc=gray

imgcolor
תיאור

אופציונלי. מחזירה תמונות בצבע דומיננטי ספציפי:

  • yellow
  • green
  • teal
  • blue
  • purple
  • pink
  • white
  • gray
  • black
  • brown
דוגמאות q=google&as_filetype=png&imgcolor=yellow

as_rights
תיאור

אופציונלי. מסננים שמבוססים על רישוי. הערכים הנתמכים כוללים:

  • cc_publicdomain
  • cc_attribute
  • cc_sharealike
  • cc_noncommercial
  • cc_nonderived

דוגמאות q=cats&as_filetype=png&as_rights=cc_attribute

מגבלות של בקשות

בתרשים הבא מפורטות המגבלות על בקשות החיפוש שנשלחות ל-Google:

רכיב הגבלה תגובה
אורך בקשת חיפוש 2,048 בייטים  
מספר מונחי השאילתה 10 כולל מונחים בפרמטרים הבאים: q, as_epq, as_eq, as_lq, as_oq, as_q
מספר התוצאות 20 אם מגדירים את הפרמטר num כמספר גדול מ-20, יוחזרו רק 20 תוצאות. כדי לקבל יותר תוצאות, צריך לשלוח כמה בקשות ולהגדיל את הערך של הפרמטר start בכל בקשה.

הפיכת שאילתות והצגת תוצאות לבינלאומיים

שירות Google WebSearch מאפשר לך לחפש מסמכים בשפות מרובות. ניתן לציין את קידוד התווים שבו יש להשתמש כדי לפרש את בקשת ה-HTTP ולקודד את תגובת ה-XML (באמצעות הפרמטרים ie ו-oe). ניתן גם לסנן את התוצאות כך שיכללו רק מסמכים שנכתבו בשפות מסוימות.

בקטעים הבאים נדון בבעיות שקשורות לחיפוש בכמה שפות:

קידוד תווים

שרתים שולחים נתונים, כמו דפי אינטרנט, לסוכני משתמש, כמו דפדפנים, בתור רצף של בייטים מקודדים. סוכן המשתמש מפענח את הבייטים לרצף של תווים. כששולחים בקשות לשירות WebSearch, אפשר לציין את סכמות הקידוד גם לשאילתת החיפוש וגם לתגובת ה-XML שמקבלים.

אפשר להשתמש בפרמטר הבקשה ie כדי לציין את מנגנון הקידוד של התווים בבקשת ה-HTTP. אפשר גם להשתמש בפרמטר oe כדי לציין את סכמת הקידוד שבה Google צריכה להשתמש כדי לקודד את תגובת ה-XML. אם משתמשים בסכמת קידוד שאינה ISO-8859-1 (או latin1), חשוב לוודא שאתם מציינים את הערכים הנכונים לפרמטרים ie ו-oe.

הערה: אם אתם מספקים פונקציונליות חיפוש לכמה שפות, אנחנו ממליצים להשתמש בערך הקידוד utf8 (UTF-8) גם לפרמטר ie וגם לפרמטר oe.

כדי לקבל רשימה מלאה של הערכים שאפשר להשתמש בהם עבור הפרמטרים ie ו-oe, אפשר לעיין בנספח סכימות קידוד תווים.

למידע כללי נוסף על קידוד תווים, אפשר לעיין בכתובת http://www.w3.org/TR/REC-html40/charset.html.

שפות ממשק

אפשר להשתמש בפרמטר הבקשה hl כדי לזהות את שפת הממשק הגרפי. ערך הפרמטר hl עשוי להשפיע על תוצאות חיפוש ב-XML, בייחוד בשאילתות בינלאומיות כשהגבלת השפה (באמצעות הפרמטר lr) לא מצוינת באופן מפורש. במקרים כאלה, הפרמטר hl עשוי לקדם תוצאות חיפוש באותה שפה כמו שפת הקלט של המשתמש.

אנחנו ממליצים להגדיר במפורש את הפרמטר hl בתוצאות החיפוש, כדי להבטיח ש-Google תבחר את תוצאות החיפוש האיכותיות ביותר לכל שאילתה.

בקטע שפות ממשק נתמכות מופיעה רשימה מלאה של הערכים החוקיים לפרמטר hl.

חיפוש מסמכים שנכתבו בשפות מסוימות

אפשר להשתמש בפרמטר הבקשה lr כדי להגביל את תוצאות החיפוש למסמכים שנכתבו בשפה מסוימת או בקבוצת שפות מסוימת.

הפרמטר lr תומך באופרטורים בוליאניים כדי לאפשר לציין מספר שפות שרוצים לכלול (או להחריג) מתוצאות החיפוש.

הדוגמאות הבאות מראות איך אפשר להשתמש באופרטורים בוליאניים כדי לבקש מסמכים בשפות שונות.

למסמכים שנכתבו ביפנית:

lr=lang_jp

למסמכים שנכתבו באיטלקית או בגרמנית:

lr=lang_it|lang_de

עבור מסמכים שאינם כתובים בהונגרית או בצ'כית:

lr=(-lang_hu).(-lang_cs)

בקטע ערכי אוסף שפות מוצגת רשימה מלאה של ערכים אפשריים לפרמטר lr ובקטע אופרטורים בוליאניים לדיון מלא לגבי השימוש באופרטורים האלה.

סינית פשוטה וסינית מסורתית הן שתי גרסאות לכתיבה של השפה הסינית. יכול להיות שאותו קונספט ייכתב בצורה שונה בכל וריאציה. בהינתן שאילתה באחת מהווריאציות, שירות Google WebSearch יכול להחזיר תוצאות שכוללות דפים בשתי הגרסאות.

כדי להשתמש בתכונה הזו:

  1. מגדירים את פרמטר הבקשה c2coff ל-0
    ו-
  2. מבצעים את אחת מהפעולות האלה:
    • אין להגדיר את פרמטר הבקשה lr
      או
    • מגדירים את פרמטר הבקשה lr ל-lr=lang_zh-TW|lang_zh-CN

בדוגמה הבאה מוצגים הפרמטרים של השאילתה שצריך לכלול בבקשה לקבלת תוצאות בסינית פשוטה וגם בסינית מסורתית. (לתשומת ליבכם: בדוגמה הזו לא נכלל מידע נדרש נוסף, כמו הלקוח).

search?hl=zh-CN
    &lr=lang_zh-TW|lang_zh-CN
    &c2coff=0

סינון התוצאות

Google WebSearch מספק מספר דרכים לסינון תוצאות החיפוש:

סינון אוטומטי של תוצאות החיפוש

במסגרת המאמצים שלנו לספק את תוצאות החיפוש המתאימות ביותר, Google משתמשת בשתי שיטות לסינון אוטומטי של תוצאות חיפוש שנחשבות באופן כללי כבלתי רצויות:

  • תוכן כפול – אם יש כמה מסמכים שהמידע שבהם זהה, רק המסמך הרלוונטי ביותר באותה קבוצה ייכלל בתוצאות החיפוש.

  • עומס ממארח – אם יש הרבה תוצאות חיפוש מאותו אתר, יכול להיות ש-Google לא תציג את כל התוצאות מאותו אתר, או שהתוצאות שיתקבלו יהיו נמוכות יותר מהדירוג שלהן
    .

מומלץ להשאיר את המסננים האלה מופעלים לבקשות חיפוש אופייניות מכיוון שהמסננים משפרים משמעותית את האיכות של רוב תוצאות החיפוש. עם זאת, אפשר לעקוף את המסננים האוטומטיים האלה על ידי הגדרת הערך של פרמטר השאילתה filter ל-0 בבקשת החיפוש.

סינון לפי שפה ומדינה

שירות Google WebSearch מחזיר תוצאות מאינדקס ראשי של כל מסמכי האינטרנט. האינדקס הראשי מכיל אוספי משנה של מסמכים שמקובצים לפי מאפיינים מסוימים, כולל שפה ומדינת המוצא.

ניתן להשתמש בפרמטרים של הבקשה lr ו-cr כדי להגביל את תוצאות החיפוש לאוספי משנה של מסמכים שנכתבו בשפות מסוימות או שמקורם במדינות מסוימות, בהתאמה.

מערכת Google WebSearch קובעת את השפה של מסמך באמצעות ניתוח של:

  • הדומיין ברמה העליונה (TLD) של כתובת ה-URL של המסמך
  • מטא תגים של שפה בתוך המסמך
  • השפה הראשית שבה כתוב הטקסט במסמך


עיינו גם בהגדרה של הפרמטר lr, בקטע חיפוש מסמכים שנכתבו בשפות ספציפיות ובערכי איסוף שפות שבהם אפשר להשתמש כערכים בפרמטר lr כדי לקבל מידע נוסף על הגבלת התוצאות על סמך שפה.

המערכת של Google WebSearch קובעת את המדינה של מסמך באמצעות ניתוח של:

  • הדומיין ברמה העליונה (TLD) של כתובת ה-URL של המסמך
  • המיקום הגיאוגרפי של כתובת ה-IP של שרת האינטרנט

למידע נוסף על הגבלת תוצאות לפי מדינת המוצא, אפשר לעיין גם בהגדרה של הפרמטר cr וב-Country במספר ערכים שיכולים לשמש כערכים של הפרמטר cr.

הערה: אפשר לשלב ערכים של שפה וערכי מדינות כדי להתאים אישית את תוצאות החיפוש. לדוגמה, אפשר לבקש מסמכים שנכתבו בצרפתית ומגיעים מצרפת או מקנדה, או לבקש מסמכים שמגיעים מהולנד ולא כתובים באנגלית. הפרמטרים lr ו-cr תומכים שניהם באופרטורים בוליאניים.

סינון תוכן למבוגרים בלבד באמצעות החיפוש הבטוח

לקוחות רבים של Google לא רוצים להציג תוצאות חיפוש של אתרים שמכילים תוכן למבוגרים בלבד. באמצעות מסנן החיפוש הבטוח שלנו ניתן לסנן תוצאות חיפוש שמכילות תוכן למבוגרים בלבד ולהסיר אותן. המסננים של Google משתמשים בטכנולוגיה קניינית כדי לבדוק מילות מפתח, ביטויים וכתובות אתרים. אמנם אין מסננים מדויקים ב-100 אחוז, אבל החיפוש הבטוח יסיר את רוב התוכן למבוגרים בלבד מתוצאות החיפוש שלך.

Google שואפת לשמור על 'חיפוש בטוח' עדכני ומקיף ככל האפשר, באמצעות סריקה רציפה של האינטרנט ושילוב עדכונים מהצעות המשתמשים.

תכונת החיפוש הבטוח זמינה בשפות הבאות:

הולנדית
אנגלית
צרפתית
גרמנית
איטלקית
פורטוגזית (ברזילאית)
ספרדית
סינית מסורתית

ניתן לשנות את המידה שבה Google מסננת את התוצאות שלך להצגת תוכן למבוגרים בלבד באמצעות פרמטר השאילתה safe. הטבלה הבאה מסבירה את הגדרות החיפוש הבטוח של Google וכיצד הגדרות אלה ישפיעו על תוצאות החיפוש שלך:

רמת החיפוש הבטוח תיאור
גבוה הפעלת גרסה מחמירה יותר של חיפוש בטוח.
medium חסימת דפי אינטרנט שמכילים פורנוגרפיה ותוכן מיני בוטה אחר.
מושבתת לא מתבצע סינון של תוכן למבוגרים בלבד מתוצאות החיפוש.

* הגדרת ברירת המחדל של החיפוש הבטוח מושבתת.

אם החיפוש הבטוח מופעל ובתוצאות מוצאים אתרים שמכילים תוכן פוגעני, יש לשלוח אימייל אל כתובת ה-URL של האתר לכתובת safesearch@google.com, ואנחנו נבדוק את האתר.

תוצאות XML

DTD של תוצאות Google XML

Google משתמשת באותו DTD כדי לתאר את פורמט ה-XML עבור כל הסוגים של תוצאות החיפוש. רבים מהתגים ומהמאפיינים חלים על כל סוגי החיפוש. עם זאת, חלק מהתגים חלים רק על סוגי חיפוש מסוימים. כתוצאה מכך, ההגדרות ב-DTD עשויות להיות פחות מגבילות מההגדרות שנקבעו במסמך הזה.

במסמך הזה מתוארים ההיבטים של DTD שרלוונטיים ל-WebSearch. כשמסתכלים על ה-DTD, אם עובדים על WebSearch, אפשר להתעלם בבטחה מתגים וממאפיינים שלא תועדו כאן. אם ההגדרה שונה בין DTD לבין התיעוד, עובדה זו מצוינת במסמך זה.

Google יכולה להחזיר תוצאות XML עם או בלי הפניה ל-DTD האחרון. ה-DTD הוא מדריך שעוזר למנהלי חיפוש ולמנתחי XML להבין את תוצאות ה-XML של Google. בגלל שדקדוק ה-XML של Google עשוי להשתנות מעת לעת, אין להגדיר את המנתח להשתמש ב-DTD כדי לאמת כל תוצאת XML.

בנוסף, אין להגדיר את מנתח ה-XML כך שיאחזר את ה-DTD בכל פעם ששולחים בקשת חיפוש. Google מעדכנת את ה-DTD לעתים רחוקות, והבקשות האלה גורמות לעיכובים מיותרים ולדרישות מיותרות של רוחב פס.

כדי לקבל תוצאות XML, Google ממליצה להשתמש בפורמט הפלט xml_no_dtd. אם מציינים את הפורמט xml output בבקשת החיפוש, ההבדל היחיד הוא הכללת השורה הבאה בתוצאות ה-XML:

<!DOCTYPE GSP SYSTEM "google.dtd">

ניתן לגשת ל-DTD העדכני ביותר בכתובת http://www.google.com/google.dtd.

לתשומת ליבכם: ייתכן שלא כל התכונות ב-DTD יהיו זמינות או נתמכות בשלב זה.

מידע על תגובת ה-XML

  • כל ערכי הרכיבים הם HTML חוקי ומתאים להצגה, אלא אם צוין אחרת בהגדרות של תגי ה-XML.
  • חלק מערכי הרכיבים הם כתובות URL שצריך להיות מקודד ב-HTML לפני שהם מוצגים.
  • מנתח ה-XML צריך להתעלם ממאפיינים ומתגים שאינם מתועדים. כך האפליקציה תמשיך לפעול ללא שינויים אם Google מוסיפה תכונות לפלט ה-XML.
  • יש תווים מסוימים שצריך לסמן אותם בתו בריחה (escape) כשהם כוללים אותם כערכים בתגי XML. מעבד ה-XML צריך להמיר את הישויות האלה לתווים המתאימים. לדוגמה, אם לא תתבצע המרה תקינה של ישויות, הדפדפן עשוי לעבד את התו & כ-"&amp;". תקן XML מתעד את התווים האלה, והתווים האלה מופיעים בטבלה הבאה:

    דמות טפסים שהוחמיצו ישות קוד תו
    סימן 'גם' (אמפרסנד) ו- &amp; &#38;
    גרש ' &apos; &#39;
    מירכאות כפולות " &quot; &#34;
    גדול מ- > &gt; &#62;
    קטן מ- < &lt; &#60;

תוצאות XML לשאילתות חיפוש רגילות ומתקדם

חיפוש רגיל/מתקדם: שאילתה לדוגמה ותוצאת XML

הבקשה לדוגמה הזו ב-WebSearch מבקשת 10 תוצאות (num=10) לגבי מונח החיפוש "socer" (q=socer), שהוא המילה "soccer" באיות שגוי בדוגמה זו.)

http://www.google.com/search?
q=socer
&hl=en
&start=10
&num=10
&output=xml
&client=google-csbe
&cx=00255077836266642015:u-scht7a-8i

הבקשה הזו מניבה את תוצאת ה-XML הבאה. שימו לב שיש מספר הערות בתוצאת ה-XML שמציינות היכן יופיעו תגים מסוימים שאינם נכללים בתוצאה.

<?xml version="1.0" encoding="ISO-8859-1" standalone="no" ?>

<GSP VER="3.2">
<TM>0.452923</TM>
<Q>socer</Q>
<PARAM name="cx" value="00255077836266642015:u-scht7a-8i" original_value="00255077836266642015%3Au-scht7a-8i"/>
<PARAM name="hl" value="en" original_value="en"/>
<PARAM name="q" value="socer" original_value="socer"/>
<PARAM name="output" value="xml" original_value="xml"/>
<PARAM name="client" value="google-csbe" original_value="google-csbe"/>
<PARAM name="num" value="10" original_value="10"/>
<Spelling>
<Suggestion q="soccer"><b><i>soccer</i></b></Suggestion>
</Spelling>
<Context>
<title>Sample Vacation CSE</title>
<Facet>
<FacetItem>
<label>restaurants</label>
<anchor_text>restaurants</anchor_text>
</FacetItem>
<FacetItem>
<label>wineries</label>
<anchor_text>wineries</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>golf_courses</label>
<anchor_text>golf courses</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>hotels</label>
<anchor_text>hotels</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>nightlife</label>
<anchor_text>nightlife</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>soccer_sites</label>
<anchor_text>soccer sites</anchor_text>
</FacetItem>
</Facet>
</Context>
<RES SN="1" EN="10">
<M>6080</M>
/*
* The FI tag after the comment indicates that the result
* set has been filtered. If the number of results were exact, the
* FI tag would be replaced by an XT tag in the same format.
*/
<FI />
<NB>
/*
* Since the request is for the first page of results, the PU tag,
* which contains a link to the previous page of search results,
* is not included in this XML result. If the sample result did include
* a previous page of results, it would be listed here, in the same format
* as the NU tag on the following line
*/
<NU>/search?q=socer&hl=en&lr=&ie=UTF-8&output=xml&client=test&start=10&sa=N</NU>
</NB>
<R N="1">
<U>http://www.soccerconnection.net/</U>
<UE>http://www.soccerconnection.net/</UE>
<T>SoccerConnection.net</T>
<CRAWLDATE>May 21, 2007</CRAWLDATE>
<S><b>soccer</b>; players; coaches; ball; world cup;<b>...</b></S>
<Label>transcodable_pages</Label>
<Label>accessible</Label>
<Label>soccer_sites</Label>
<LANG>en</LANG>
<HAS>
<DI>
<DT>SoccerConnection.net</DT>
<DS>Post your <b>soccer</b> resume directly on the Internet.</DS>
</DI>
<L/>
<C SZ="8k" CID="kWAPoYw1xIUJ"/>
<RT/>
</HAS>
</R>
/*
* The result includes nine more results, each enclosed by an R tag.
*/
</RES>
</GSP>

חיפוש רגיל/מתקדם: תגי XML

תגובות XML לבקשות חיפוש רגילות ובקשות לחיפוש מתקדם משתמשות באותה קבוצה של תגי XML. תגי ה-XML האלה מוצגים בדוגמה של ה-XML שלמעלה, ומפורטים בטבלאות שבהמשך.

תגי ה-XML הבאים מפורטים בסדר אלפביתי לפי שם התג, וכל הגדרת תג כוללת תיאור של התג. דוגמה שמראה איך התג ייראה בתוצאת XML ואת הפורמט של תוכן התג. אם התג הוא תג משנה של תג XML אחר, או אם יש לתג תגי משנה או מאפיינים משלו, המידע הזה מסופק גם בטבלת ההגדרות של התג.

ייתכן שסמלים מסוימים יוצגו לצד תגי משנה בהגדרות שלמטה. לפניכם פירוט של הסמלים והמשמעויות שלהם:

? = תג משנה אופציונלי
* = אפס מופעים או יותר של תג המשנה
+ = מופע אחד או יותר של תג המשנה
א B C G א ל נ צ ש R T U X

anchor_text
הגדרה

התג <anchor_text> מציין את הטקסט שצריך להציג למשתמשים כדי לזהות תווית חידוד שמשויכת לקבוצת תוצאות חיפוש. תוויות החידוד מחליפות תווים שאינם אלפאנומריים בקווים תחתונים, ולכן אין להציג את הערך של התג <label> בממשק המשתמש. במקום זאת, צריך להציג את הערך של התג <anchor_text>.

דוגמה <anchor_text>מסלולי גולף</anchor_text>
תג משנה של FacetItem
פורמט התוכן טקסט

חסימה
הגדרה

התג הזה כולל את התוכן של בלוק בשורה גוף של תוצאת קידום. לכל בלוק יש את תגי המשנה T, U ו-L. תג T שאינו ריק מציין שהבלוק מכיל טקסט; תגי U ו-L שאינם ריקים מציינים שהבלוק מכיל קישור (כאשר כתובת ה-URL מצוינת בתג המשנה U, וטקסט העוגן בתג המשנה L).

תגי משנה T, U, L
תג משנה של BODY_LINE
פורמט התוכן ריק

BODY_LINE
הגדרה

תג זה כולל את התוכן של שורה בגוף התוצאה המקודמת. כל שורת גוף כוללת כמה תגי BLOCK, שמכילים טקסט או קישור עם כתובת URL וטקסט עוגן.

תגי משנה חסימה*
תג משנה של SL_MAIN
פורמט התוכן ריק

C
הגדרה

התג <C> מציין ששירות WebSearch יכול לאחזר גרסה שנשמרה במטמון של כתובת ה-URL של תוצאת החיפוש הזו. לא ניתן לאחזר דפים שנשמרו במטמון דרך XML API, אבל אפשר להפנות את המשתמשים לכתובת www.google.com של התוכן הזה.

מאפיינים
שם פורמט תיאור
SZ טקסט (מספר שלם + 'k') מספק את הגודל של גרסת המטמון של תוצאת החיפוש בקילובייט ("k").
CID טקסט מזהה מסמך במטמון של Google. כדי לאחזר את המסמך מהמטמון, צריך לשלוח מונח חיפוש שנוצר באופן הבא:
cache:CIDtext:escapedURL

כתובת ה-URL שמסומנת בתו בריחה (escape) זמינה בתג UE.

דוגמה <C SZ="6k" CID="kvOXK_cYSSgJ" />
תג משנה של HAS
פורמט התוכן ריק

C2C
הגדרה התג <C2C> מציין שהתוצאה מתייחסת לדף בשפה הסינית מסורתית. התג הזה מופיע רק כאשר מופעל חיפוש בסינית פשוטה ומסורתית. מידע נוסף על הפעלה והשבתה של התכונה הזו זמין בהגדרת פרמטר השאילתה c2coff.
פורמט התוכן טקסט

הקשר
הגדרה

התג <Context> כולל רשימה של תוויות חידוד שמשויכות לקבוצה של תוצאות חיפוש.

דוגמה <Context>
תגי משנה title, Facet+
פורמט התוכן מאגר

תכנון
הגדרה

התג <CRAWLDATE> מזהה את התאריך שבו הדף נסרק לאחרונה. הפונקציה CRAWLDATE לא מוחזרת לכל דף תוצאות חיפוש.

דוגמה <CRAWLDATE>21 במאי, 2005</CRAWLDATE>
תג משנה של R
פורמט התוכן טקסט

עשה זאת בעצמך
הגדרה

התג <DI> כולל את פרטי הקטגוריה של Open Directory Project (ODP) של תוצאת חיפוש אחת.

דוגמה <DI>
תגי משנה DT?, DS?
תג משנה של HAS
פורמט התוכן ריק

DS
הגדרה

התג <DS> מספק את הסיכום המפורט של קטגוריה אחת בספריית ה-ODP.

דוגמה <DS>פרסום של קורות החיים שלך &lt;b&gt;soccer&lt;/b&gt; ישירות באינטרנט.</DS>
תג משנה של DI
פורמט התוכן טקסט (עשוי להכיל HTML)

DT
הגדרה

התג <DT> מספק את הכותרת של קטגוריה יחידה שרשומה בספריית ODP.

דוגמה <DT>כדורגלConnection.net</DT>
תג משנה של DI
פורמט התוכן טקסט (עשוי להכיל HTML)

מאפיין
הגדרה

התג <Facet> מכיל קיבוץ לוגי של תגי <FacetItem>. אפשר ליצור את הקבוצות האלה באמצעות פורמט מפרט XML של Programmable Search Engine. אם לא יוצרים את הקבוצות האלה, התג results_xml_tag_Context><Context> מכיל עד ארבעה תגי <Facet>. הפריטים בכל תג <Facet> יקובצו למטרות תצוגה, אבל יכול להיות שלא יהיה להם קשר לוגי.

דוגמה <Facet>
תגי משנה FacetItem+, title+
תג משנה של הֶקשר
פורמט התוכן מאגר

FacetItem
הגדרה

התג <FacetItem> כולל מידע על תווית חידוד המשויכת לקבוצת תוצאות חיפוש.

דוגמה <FacetItem>
תגי משנה label, anchor_text+
תג משנה של היבט
פורמט התוכן FacetItem

FI
הגדרה התג <FI> משמש כסימון שמציין אם בוצע סינון מסמכים עבור החיפוש. אפשר לקרוא מידע נוסף על המסננים של תוצאות החיפוש של Google בקטע סינון אוטומטי במסמך הזה.
דוגמה <FI />
תג משנה של רזולוציה
פורמט התוכן ריק

קידום מודעות ב-Google
הגדרה

התג <GSP> כולל את כל הנתונים שהוחזרו בתוצאות החיפוש של Google בפורמט XML. "GSP" הוא קיצור של "פרוטוקול חיפוש Google".

מאפיינים
שם פורמט תיאור
ערך טקסט (מספר שלם) המאפיין VER מציין את הגרסה של פלט תוצאות החיפוש. גרסת הפלט הנוכחית היא '3.2'.
דוגמה <GSP VER="3.2">
תגי משנה PARAM+, Q, RES?, סימן מסחרי
פורמט התוכן ריק

HAS
הגדרה התג <HAS> כולל מידע על כל פרמטרים מיוחדים של בקשת חיפוש שנתמכים בכתובת אתר מסוימת.

הערה: ההגדרה של <HAS> עבור WebSearch מגבילה יותר מאשר ב-DTD.

תגי משנה DI?, L?, C?, RT?
תג משנה של R

כתובת ISURL
הגדרה Google מחזירה את התג <ISURL> אם שאילתת החיפוש המשויכת היא כתובת URL.
תג משנה של GSP
פורמט התוכן ריק

L
הגדרה נוכחות התג <L> מציינת ששירות WebSearch יכול למצוא אתרים אחרים שמקשרים לכתובת האתר הזו של תוצאת החיפוש. כדי למצוא אתרים כאלה, אפשר להשתמש במונח השאילתה המיוחד link:.
תג משנה של HAS
פורמט התוכן ריק

label
הגדרה

התג <label> מציין תווית חידוד שדרכה אפשר להשתמש כדי לסנן את תוצאות החיפוש שיתקבלו. כדי להשתמש בתווית חידוד, צריך להוסיף את המחרוזת עוד:[[label tag value]] לערך של הפרמטר q בבקשת ה-HTTP אל Google, כפי שמוצג בדוגמה הבאה. חשוב לשים לב שצריך לסמן את הערך הזה בתו בריחה (escape) של כתובת ה-URL לפני שליחת השאילתה ל-Google.

This example uses the refinement label golf_courses to
filter search results about Palm Springs:
q=Palm+Springs+more:golf_courses

The URL-escaped version of this query is:
q=Palm+Springs+more%3Agolf_courses

הערה: התג <label> שונה מהתג <Label>, שמזהה תווית חידוד המשויכת לכתובת אתר מסוימת בתוצאות החיפוש שלך.

דוגמה <label>golf_courses</label>
תג משנה של FacetItem
פורמט התוכן טקסט

שפה
הגדרה

התג <LANG> מכיל את הניחוש הטוב ביותר של Google לגבי השפה של תוצאת החיפוש.

דוגמה <LANG>en</LANG>
תג משנה של R
פורמט התוכן טקסט

M
הגדרה

התג <M> מזהה את המספר הכולל המשוער של תוצאות החיפוש.

הערה: יכול להיות שהאומדן הזה לא מדויק.

דוגמה <M>16200000</M>
תג משנה של רזולוציה
פורמט התוכן טקסט

NB
הגדרה

התג <NB> כולל את פרטי הניווט של קבוצת התוצאות, כלומר קישורים לדף הבא של תוצאות החיפוש או לדף הקודם של תוצאות החיפוש.

הערה: התג הזה קיים רק אם יש תוצאות נוספות.

דוגמה <NB>
תגי משנה NU?, PU?
תג משנה של רזולוציה
פורמט התוכן ריק

נוב'
הגדרה

התג <NU> מכיל קישור יחסי לדף הבא של תוצאות החיפוש.

דוגמה <NU>/search?q=flowers&num=10&hl=iw&ie=UTF-8
&output=xml&client=test&start=10</NU>
תג משנה של NB
פורמט התוכן טקסט (כתובת URL יחסית)

פרמטר
הגדרה

התג <PARAM> מזהה פרמטר קלט שנשלח בבקשת ה-HTTP המשויכת לתוצאת ה-XML. מידע על הפרמטר נכלל במאפייני התג — שם, ערך, מקורי_value — ויתקבל תג PARAM אחד לכל פרמטר שנשלח בבקשת ה-HTTP.

מאפיינים
שם פורמט תיאור
name טקסט שם פרמטר קלט.
ערך HTML גרסה בפורמט HTML של ערך הפרמטר של הקלט.
original_value טקסט הגרסה המקורית של קוד escape בכתובת URL של ערך פרמטר הקלט.
דוגמה <PARAM name="cr" value="countryNZ" source_value="countryNZ" />
תג משנה של GSP
פורמט התוכן רמה למתקדמים מאוד

יחידת קיבולת (PU)
הגדרה

התג <PU> מספק קישור יחסי לדף הקודם של תוצאות החיפוש.

דוגמה <PU>/search?q=flowers&num=10&hl=iw&output=xml
&client=test&start=10</PU>
תג משנה של NB
פורמט התוכן טקסט (כתובת URL יחסית)

Q
הגדרה

התג <Q> מזהה את שאילתת החיפוש שנשלחה בבקשת ה-HTTP שמשויכת לתוצאת ה-XML.

דוגמה

<Q>pizza</Q>

תג משנה של GSP
פורמט התוכן טקסט

R
הגדרה

התג <R> כולל את הפרטים של תוצאת חיפוש בודדת.

הערה: ההגדרה של התג <R> ב-WebSearch מגבילה יותר מאשר ב-DTD.

מאפיינים
שם פורמט תיאור
צ' טקסט (מספר שלם) מציין את האינדקס (מבוסס 1) של תוצאת החיפוש הזו.
MIME טקסט מציין את סוג ה-MIME של תוצאת החיפוש.
תגי משנה U, UE, T?, CRAWLDATE, S?, lang?, HAS
תג משנה של רזולוציה

מחדש
הגדרה

התג <RES> כולל את הקבוצה של תוצאות החיפוש הנפרדות ואת הפרטים על התוצאות האלה.

מאפיינים
שם פורמט תיאור
SN טקסט (מספר שלם) מציין את האינדקס (מבוסס 1) של תוצאת החיפוש הראשונה שהוחזרה בקבוצת התוצאות הזו.
IW טקסט (מספר שלם) מציין את האינדקס (מבוסס 1) של תוצאת החיפוש האחרונה שהוחזרה בקבוצת התוצאות הזו.
דוגמה <RES SN="1" EN="10">
תגי משנה M, FI?, XT?, NB?, R*
תג משנה של GSP
פורמט התוכן ריק

S
הגדרה

התג <S> מכיל קטע מתוך תוצאת חיפוש, שמונחי השאילתה מודגשים. מעברי שורה נכללים בקטע כדי לאפשר גלישת טקסט תקינה.

דוגמה <S>וושינגטון (CNN) -- הצעת מחיר לסיום העימות בסנאט מול הנשיא &lt;b&gt;Bush&#39;s&lt;/b&gt; הבחירות המשפטיות תאפשר לחמישה מועמדים להתקדם להצבעה סופית תוך שימור &lt;b&gt;...&lt;b&gt;...&lt;/b>
תג משנה של R
פורמט התוכן טקסט (HTML)

SL_MAIN
הגדרה

תג זה כולל את התוכן של תוצאת קידום מכירות. משמש לניתוח מבצעים. טקסט העוגן וכתובת ה-URL של קישור הכותרת נכללים בתגי המשנה T ו-U, בהתאמה. השורות והקישורים בגוף הטקסט כלולים בתגי משנה של BODY_LINE.

תגי משנה BODY_LINE*, T, U
תג משנה של SL_RESULTS
פורמט התוכן ריק

SL_RESULTS
הגדרה

תג מאגר לתוצאות מקודמים. אחד מהסטטוסים האלה יופיע בכל פעם שיופיע קידום מכירות בתוצאות החיפוש שלכם. תג המשנה SL_MAIN מכיל את נתוני התוצאה העיקריים.

תגי משנה SL_MAIN*
תג משנה של R
פורמט התוכן ריק

איות
הגדרה

התג <Spelling> כולל הצעת איות חלופית לשאילתה שנשלחה. התג הזה מופיע רק בדף הראשון של תוצאות החיפוש. הצעות איות זמינות באנגלית, בסינית, ביפנית ובקוריאנית.

הערה: Google תחזיר הצעות איות רק לשאילתות שבהן ערך הפרמטר gl מופיע באותיות קטנות.

דוגמה <Spelling>
תגי משנה הצעה
תג משנה של GSP
פורמט התוכן ריק

הצעה
הגדרה התג <Suggestion> מכיל הצעת איות חלופית לשאילתה שנשלחה. אפשר להשתמש בתוכן התג כדי להציע את האיות החלופי למשתמש בחיפוש. הערך של המאפיין q הוא הצעת האיות עם קוד Escape בכתובת URL, שאפשר להשתמש בה כמונח לשאילתה.
מאפיינים
שם אופן הלימוד תיאור
q טקסט המאפיין q מציין את הגרסה של הצעת האיות כתובת URL שמסומנת בתו בריחה (escape).
דוגמה <Suggestion q="soccer">&lt;b&gt;&lt;i&gt;soccer&lt;/i&gt;&lt;/b&gt;</Suggestion>
תג משנה של איות
פורמט התוכן טקסט (HTML)

T
הגדרה התג <T> מכיל את הכותרת של התוצאה.
דוגמה <T>החוף המזרחי של עמיצ'י פיצרייה</T>
תג משנה של R
פורמט התוכן טקסט (HTML)

שם פריט
הגדרה

כצאצא של <Context>, התג <title> מכיל את השם של Programmable Search Engine.

כצאצא של <Facet>, התג <title> מספק כותרת לקבוצת מאפיינים.

דוגמה

כצאצא של <Context>: <title>מנוע החיפוש My Search</title>

כצאצא של <Facet>: <title>facet title</title>

תג משנה של הקשר, Facet
פורמט התוכן טקסט

TM
הגדרה

התג <TM> מזהה את הזמן הכולל שנדרש לשרת כדי להחזיר תוצאות חיפוש. הזמן נמדד בשניות.

דוגמה <TM>0.100445</TM>
תג משנה של GSP
פורמט התוכן טקסט (מספר מרחף)

TT
הגדרה התג <TT> מספק טיפ לחיפוש.
דוגמה <TT>&lt;i&gt;טיפ: ברוב הדפדפנים, הקשה על מקש Return מניבה את אותן התוצאות כמו לחיצה על לחצן החיפוש.&lt;/i&gt;</TT>
תג משנה של GSP

U
הגדרה התג <U> מספק את כתובת ה-URL של תוצאת החיפוש.
דוגמה <U>http://www.dominos.com/</U>
תג משנה של R
פורמט התוכן טקסט (כתובת URL מוחלטת)

דולר ארה"ב (UD)
הגדרה

התג <UD> מספק את כתובת ה-URL עם קידוד IDN (שם דומיין בינלאומי) עבור תוצאת החיפוש. הערך מאפשר להציג דומיינים בשפות מקומיות. לדוגמה, אפשר לפענח את כתובת ה-URL בקידוד IDN http://www.%E8%8A%B1%E4%BA%95.com ולהציג אותה כך: http://www.花 בקריטריונים鮨.com. התג <UD> יופיע בתוצאות החיפוש רק לבקשות הכוללות את הפרמטר ud.

הערה: זוהי תכונת בטא.

דוגמה <UD>http://www.%E8%8A%B1%E4%BA%95.com/</UD>
תג משנה של R
פורמט התוכן טקסט (כתובת URL בקידוד IDN)

UE
הגדרה התג <UE> מספק את כתובת ה-URL של תוצאת החיפוש. הערך מסומן בתו בריחה (escape) של כתובת URL כך שהוא יתאים להעברה כפרמטר של שאילתה בכתובת URL.
דוגמה <UE>http://www.dominos.com/</UE>
תג משנה של R
פורמט התוכן טקסט (כתובת URL עם תו בריחה (escape))

XT
הגדרה התג <XT> מציין שהמספר הכולל המשוער של התוצאות, כפי שצוין בתג M, מייצג למעשה את המספר הכולל המדויק של התוצאות. אפשר לקרוא פרטים נוספים בקטע Automatic Filter במסמך הזה.
דוגמה <XT />
תג משנה של רזולוציה
פורמט התוכן ריק


תוצאות XML לשאילתות חיפוש תמונות

בקשת התמונה לדוגמה הזו מבקשת 5 תוצאות (num=5) לגבי מונח החיפוש 'קוף' (q=קוף).

http://www.google.com/cse?
  searchtype=image
  &num=2
  &q=monkey
  &client=google-csbe
  &output=xml_no_dtd
  &cx=00255077836266642015:u-scht7a-8i

הבקשה הזו מניבה את תוצאת ה-XML הבאה.


<GSP VER="3.2">
  <TM>0.395037</TM>
  <Q>monkeys</Q>

  <PARAM name="cx" value="011737558837375720776:mbfrjmyam1g" original_value="011737558837375720776:mbfrjmyam1g" url_<escaped_value="011737558837375720776%3Ambfrjmyam1g" js_escaped_value="011737558837375720776:mbfrjmyam1g"/>
  <PARAM name="client" value="google-csbe" original_value="google-csbe" url_escaped_value="google-csbe" js_escaped_value="google-csbe"/>
  <PARAM name="q" value="monkeys" original_value="monkeys" url_escaped_value="monkeys" js_escaped_value="monkeys"/>
  <PARAM name="num" value="2" original_value="2" url_escaped_value="2" js_escaped_value="2"/>
  <PARAM name="output" value="xml_no_dtd" original_value="xml_no_dtd" url_escaped_value="xml_no_dtd" js_escaped_value="xml_no_dtd"/>
  <PARAM name="adkw" value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" original_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" url_escaped_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" js_escaped_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A"/>
  <PARAM name="hl" value="en" original_value="en" url_escaped_value="en" js_escaped_value="en"/>
  <PARAM name="oe" value="UTF-8" original_value="UTF-8" url_escaped_value="UTF-8" js_escaped_value="UTF-8"/>
  <PARAM name="ie" value="UTF-8" original_value="UTF-8" url_escaped_value="UTF-8" js_escaped_value="UTF-8"/>
  <PARAM name="boostcse" value="0" original_value="0" url_escaped_value="0" js_escaped_value="0"/>

  <Context>
    <title>domestigeek</title>
  </Context>

  <ARES/>
  <RES SN="1" EN="2">
    <M>2500000</M>
    <NB>
      <NU>/images?q=monkeys&num=2&hl=en&client=google-csbe&cx=011737558837375720776:mbfrjmyam1g&boostcse=0&output=xml_no_dtd
        &ie=UTF-8&oe=UTF-8&tbm=isch&ei=786oTsLiJaaFiALKrPChBg&start=2&sa=N
      </NU>
    </NB>
    <RG START="1" SIZE="2"/>
      <R N="1" MIME="image/jpeg">
        <RU>http://www.flickr.com/photos/fncll/135465558/</RU>
        <U>
          http://farm1.static.flickr.com/46/135465558_123402af8c.jpg
        </U>
        <UE>
          http://farm1.static.flickr.com/46/135465558_123402af8c.jpg
        </UE>
        <T>Computer <b>Monkeys</b> | Flickr - Photo Sharing!</T>
        <RK>0</RK>
        <BYLINEDATE>1146034800</BYLINEDATE>
        <S>Computer <b>Monkeys</b> | Flickr</S>
        <LANG>en</LANG>
        <IMG WH="500" HT="305" IID="ANd9GcQARKLwzi-t4lpWi2AERV3kJb4ansaQzTn3MNDZR9fD_JDiktPKByKUBLs">
          <SZ>88386</SZ>
          <IN/>
        </IMG>
        <TBN TYPE="0" WH="130" HT="79" URL="http://t0.gstatic.com/images?q=tbn:ANd9GcQARKLwzi-
t4lpWi2AERV3kJb4ansaQzTn3MNDZR9fD_JDiktPKByKUBLs"/>
      </R>
      <R N="2" MIME="image/jpeg">
        <RU>
          http://www.flickr.com/photos/flickerbulb/187044366/
        </RU>
        <U>
          http://farm1.static.flickr.com/73/187044366_506a1933f4.jpg
        </U>
        <UE>
          http://farm1.static.flickr.com/73/187044366_506a1933f4.jpg
        </UE>
        <T>
          one. ugly. <b>monkey</b>. | Flickr - Photo Sharing!
        </T>
        <RK>0</RK>
        <BYLINEDATE>1152514800</BYLINEDATE>
        <S>one. ugly. <b>monkey</b>.</S>
        <LANG>en</LANG>
        <IMG WH="400" HT="481" IID="ANd9GcQ3Qom0bYbee4fThCQVi96jMEwMU6IvVf2b8K5vERKVw-
           EF4tQQnDDKOq0"><SZ>58339</SZ>
          <IN/>
        </IMG>
        <TBN TYPE="0" WH="107" HT="129" URL="http://t1.gstatic.com/images?q=tbn:ANd9GcQ3Qom0bYbee4fThCQ
          Vi96jMEwMU6IvVf2b8K5vERKVw-EF4tQQnDDKOq0"/>
      </R>
  </RES>
</GSP>

חיפוש תמונות: תגי XML

הטבלה הבאה מציגה תגי XML נוספים שמשמשים בתגובות XML לשאילתות של חיפוש תמונות.

ייתכן שסמלים מסוימים יוצגו לצד תגי משנה בהגדרות שלמטה. לפניכם פירוט של הסמלים והמשמעויות שלהם:

? = תג משנה אופציונלי
* = אפס מופעים או יותר של תג המשנה
+ = מופע אחד או יותר של תג המשנה

RG
הגדרה

התג <RG> תוחם את הפרטים של תוצאת חיפוש של תמונה בודדת.

מאפיינים
שם פורמט תיאור
צ' טקסט (מספר שלם) מציין את האינדקס (מבוסס 1) של תוצאת החיפוש הזו.
MIME טקסט מציין את סוג ה-MIME של תוצאת החיפוש.
תג משנה של רזולוציה
RU
הגדרה

התג <RU tag> כולל את הפרטים של כל תוצאת חיפוש של תמונה.

תג משנה של R