Справочник XML-API

На этой странице рассматривается XML-версия API пользовательского поиска в формате JSON, доступная только пользователям Google Site Search .

  1. Обзор
  2. Программируемый формат запроса поисковой системы
    1. Обзор запроса
    2. Ключевые слова запроса
    3. Параметры запроса
      1. Примеры поисковых запросов в интернете
      2. Определения параметров запроса WebSearch
      3. Расширенный поиск
      4. Расширенные параметры поискового запроса
      5. Специальные термины запроса
      6. Примеры запросов изображений
      7. Параметры запроса для поиска изображений
      8. Ограничения на запросы
    4. Интернационализация запросов и презентация результатов
      1. Кодировка символов
      2. Языки интерфейса
      3. Упрощенный и традиционный китайский поиск
    5. Фильтрация результатов
      1. Автоматическая фильтрация результатов поиска
      2. Фильтрация по языку и стране
      3. Фильтрация контента для взрослых с помощью SafeSearch
  3. Результаты XML
    1. Результаты поиска Google по XML DTD
    2. О XML-ответе
    3. Результаты поиска в формате XML для обычного поиска, поиска по изображениям и расширенного поиска.
      1. Обычный/расширенный поиск: пример запроса и результат в формате XML.
      2. Обычный/расширенный поиск: XML-теги
      3. Результаты поиска изображений в формате XML
      4. Поиск изображений: пример запроса и XML-результат
      5. Поиск изображений: XML-теги

Обзор

Сервис Google WebSearch позволяет клиентам Google Site Search отображать результаты поиска Google на своих собственных веб-сайтах. Сервис WebSearch использует простой протокол на основе HTTP для предоставления результатов поиска. Администраторы поиска имеют полный контроль над тем, как они запрашивают результаты поиска и как они представляют эти результаты конечному пользователю. В этом документе описываются технические детали запроса результатов поиска Google и их форматов.

Для получения результатов веб-поиска Google ваше приложение отправляет Google простой HTTP-запрос. Затем Google возвращает результаты поиска в формате XML. Результаты в формате XML позволяют настраивать способ отображения результатов поиска.

Формат запроса веб-поиска

Обзор запроса

Поисковый запрос Google — это стандартная команда HTTP GET . Она включает в себя набор параметров, относящихся к вашим запросам. Эти параметры включаются в URL-адрес запроса в виде пар «имя=значение», разделенных символами амперсанда (&). Параметры содержат такие данные, как поисковый запрос и уникальный идентификатор поисковой системы ( cx ), который идентифицирует систему, выполняющую HTTP-запрос. Сервис WebSearch или Image Search возвращает XML-результаты в ответ на ваши HTTP-запросы.

Ключевые слова запроса

Большинство поисковых запросов содержат один или несколько ключевых слов. Ключевое слово отображается в качестве значения параметра в поисковом запросе.

В поисковых запросах можно указывать различные типы информации для фильтрации и организации результатов поиска, которые выдает Google. Запросы могут содержать следующие сведения:

  • Слова или фразы, которые следует включить или исключить.
    • Все слова в поисковом запросе (по умолчанию)
    • Точная фраза в поисковом запросе
    • Любое слово или фраза в поисковом запросе
  • Где в документе искать поисковые запросы?
    • В любом месте документа (по умолчанию)
    • Только в ссылках в документе
  • Ограничения на сами документы
    • Включение или исключение документов определенных типов (например, файлов PDF или документов Word).
  • Специальные URL-запросы , которые возвращают информацию о заданном URL-адресе, вместо выполнения поиска.
    • Запросы, возвращающие общую информацию об URL-адресе, такую ​​как категория в Open Directory, фрагмент кода или язык.
    • Запросы, возвращающие набор веб-страниц, которые ссылаются на указанный URL.
    • Запросы, возвращающие набор веб-страниц, похожих на заданный URL.

Поиск по умолчанию

Значения параметров поискового запроса должны быть экранированы в соответствии с URL-адресом. Обратите внимание, что знаки плюса («+») следует заменять любыми последовательностями пробелов в поисковом запросе. Это более подробно обсуждается в разделе «Экранирование URL-адресов » данного документа.

Поисковый запрос передается в службу WebSearch с помощью параметра q . Пример поискового запроса:

q=horses+cows+pigs

По умолчанию сервис Google WebSearch возвращает только те документы, которые содержат все термины поискового запроса.

Параметры запроса

В этом разделе перечислены параметры, которые можно использовать при выполнении поискового запроса. Параметры разделены на два списка. Первый список содержит параметры, относящиеся ко всем поисковым запросам. Второй список содержит параметры, относящиеся только к расширенным поисковым запросам.

Требуются три параметра запроса:

  • Параметр клиента должен быть установлен на google-csbe
  • Параметр output задает формат возвращаемых XML-результатов; результаты могут быть возвращены с (xml) или без ( xml_no_dtd ) ссылки на DTD Google. Мы рекомендуем установить это значение равным xml_no_dtd . Примечание: если вы не укажете этот параметр, результаты будут возвращены в формате HTML вместо XML.
  • Параметр cx , представляющий собой уникальный идентификатор движка.

Помимо упомянутых выше, наиболее часто используемые параметры запроса следующие:

  • num — запрошенное количество результатов поиска
  • q — поисковый запрос (запросы)
  • начало — начальный индекс для результатов

Примеры поисковых запросов в интернете

Приведенные ниже примеры демонстрируют несколько HTTP-запросов WebSearch, чтобы показать, как используются различные параметры запроса. Определения различных параметров запроса приведены в разделах «Определения параметров запроса WebSearch» и « Расширенные параметры поискового запроса» данного документа.

Этот запрос запрашивает первые 10 результатов ( start=0&num=10 ) по поисковому запросу "red sox" ( q=red+sox ). Запрос также указывает, что результаты должны быть получены с канадских веб-сайтов ( cr=countryCA ) и должны быть написаны на французском языке ( lr=lang_fr ). Наконец, запрос задает значения для параметров client , output и cx , все три из которых являются обязательными.

http://www.google.com/search?
start=0
&num=10
&q=red+sox
&cr=countryCA
&lr=lang_fr
&client=google-csbe
&output=xml_no_dtd
&cx=00255077836266642015:u-scht7a-8i

В этом примере используются некоторые расширенные параметры поискового запроса для его дальнейшей настройки. В этом запросе используется параметр as_q ( as_q=red+sox ) вместо параметра q . Также используется параметр as_eq для исключения из результатов поиска любых документов, содержащих слово "Yankees" ( as_eq=yankees ).

http://www.google.com/search?
start=0
&num=10
&as_q=red+sox
&as_eq=Yankees
&client=google-csbe
&output=xml_no_dtd
&cx=00255077836266642015:u-scht7a-8i

Определения параметров запроса WebSearch

c2coff
Описание

Необязательный параметр . Параметр c2coff включает или отключает функцию поиска на упрощенном и традиционном китайском языках .

Значение по умолчанию для этого параметра равно 0 (нулю), что означает, что функция включена. Возможные значения параметра c2coff :

Ценить Действие
1 Неполноценный
0 Включено
Примеры q=google&c2coff=1

клиент
Описание

Обязательно . Параметр client должен быть установлен на google-csbe .

Примеры q=google&client=google-csbe

кр
Описание

Параметр cr необязателен . Он ограничивает результаты поиска документами, происходящими из определенной страны. В значении параметра cr можно использовать логические операторы .

Поисковая система Google определяет страну документа, анализируя следующие данные:

  • домен верхнего уровня (TLD) URL-адреса документа
  • географическое местоположение IP-адреса веб-сервера

Список допустимых значений для этого параметра см. в разделе « Значения параметра Страна (cr)» .

Примеры q=Frodo&cr=countryNZ

кс
Описание

Обязательный параметр. Параметр cx задает уникальный код, идентифицирующий пользовательскую поисковую систему. Для получения результатов поиска из этой системы необходимо указать программируемую поисковую систему с помощью параметра cx .

Чтобы узнать значение параметра cx , перейдите в Панель управления > вкладка «Коды» вашего поискового движка, и вы найдете его в текстовом поле под заголовком «Вставьте этот код на страницу, где вы хотите, чтобы отображалось поле поиска. Результаты поиска будут показаны на странице, размещенной Google».

Примеры q=Frodo&cx=00255077836266642015:u-scht7a-8i

фильтр
Описание

Необязательный параметр . Параметр filter активирует или деактивирует автоматическую фильтрацию результатов поиска Google. Дополнительную информацию о фильтрах результатов поиска Google см. в разделе «Автоматическая фильтрация» этого документа.

Значение по умолчанию для параметра filter равно 1 , что означает, что функция включена. Допустимые значения для этого параметра:

Ценить Действие
1 Неполноценный
0 Включено

Примечание: По умолчанию Google применяет фильтрацию ко всем результатам поиска для повышения их качества.

Примеры q=google&filter=0

гл
Описание

Параметр gl является необязательным . Значение параметра gl представляет собой двухбуквенный код страны. Для результатов веб-поиска параметр gl повышает рейтинг результатов поиска, страна происхождения которых соответствует значению параметра. Список допустимых значений см. в разделе « Коды стран» .

Указание значения параметра gl в запросах WebSearch должно повысить релевантность результатов. Это особенно актуально для международных клиентов и, в частности, для клиентов из англоязычных стран, отличных от США.

Примеры

Этот запрос повышает позиции документов, написанных в Великобритании, в результатах веб-поиска:
q=pizza&gl=uk


hl
Описание

Необязательный параметр. Параметр hl задает язык интерфейса (язык хоста) вашего пользовательского интерфейса. Для повышения производительности и качества результатов поиска настоятельно рекомендуется явно указывать этот параметр.

Дополнительную информацию см. в разделе «Языки интерфейса» документа «Интернационализация запросов и представления результатов», а список поддерживаемых языков интерфейса — в разделе «Поддерживаемые языки интерфейса» .

Примеры

Этот запрос направлен на рекламу вина на французском языке. ( Vin — французский термин для обозначения вина.)

q=vin&ip=10.10.10.10&ad=w5& hl=fr

штаб-квартира
Описание

Параметр hq необязателен . Он добавляет указанные термины запроса к самому запросу, как если бы они были объединены логическим оператором И.

Примеры

Этот запрос ищет слова «пицца» И «сыр». Выражение аналогично q=pizza+cheese .

q=pizza&hq=cheese


т.е.
Описание

Необязательный параметр. Параметр ie задает схему кодировки символов, которая должна использоваться для интерпретации строки запроса. Значение ie по умолчанию — latin1 .

В разделе « Кодировка символов» обсуждается, когда может потребоваться использование этого параметра.

Список возможных значений ie см. в разделе « Схемы кодирования символов» .

Примеры q=google&ie=utf8&oe=utf8
лр
Описание

Необязательный параметр. Параметр lr (language restrict) ограничивает результаты поиска документами, написанными на определенном языке.

Поисковая система Google определяет язык документа, анализируя следующие данные:

  • домен верхнего уровня (TLD) URL-адреса документа
  • языковые метатеги в документе
  • основной язык, используемый в основном тексте документа
  • Если таковые имеются, то на каких дополнительных языках, используемых в основном тексте документа.

Список допустимых значений для этого параметра см. в разделе « Значения коллекции языка ( lr .

Примеры q=Frodo&lr=lang_en

число
Описание

Необязательный параметр. Параметр num определяет количество результатов поиска, которые необходимо вернуть.

num по умолчанию — 10 , максимальное значение — 20 Если вы запросите более 20 результатов, будет возвращено только 20 результатов.

Примечание: Если общее количество результатов поиска меньше запрошенного, будут возвращены все доступные результаты поиска.

Примеры q=google& num=10

ое
Описание

Необязательный параметр. Параметр oe задает схему кодировки символов, которая должна использоваться для декодирования результата XML. Значение oe по умолчанию — latin1 .

В разделе « Кодировка символов» обсуждается, когда может потребоваться использование этого параметра.

Список возможных значений oe см. в разделе « Схемы кодирования символов» .

Примеры q=google&ie=utf8& oe=utf8

выход
Описание

Обязательный параметр . output параметр определяет формат результатов в формате XML. Единственно допустимые значения для этого параметра — xml и xml_no_dtd . В таблице ниже показано, чем отличаются значения этих параметров.

Ценить Формат вывода
xml_no_dtd В результатах поиска XML не будет содержаться оператор !DOCTYPE. (Рекомендуется)
xml В результатах поиска XML будет содержаться ссылка на DTD Google. Во второй строке результата будет указан тип определения документа (DTD), используемый в результатах:
    <!DOCTYPE GSP SYSTEM "google.dtd">
Примеры output=xml_no_dtd
output=xml

q
Описание

Необязательный параметр. Параметр q задает поисковый запрос, введенный пользователем. Несмотря на то, что этот параметр необязателен, необходимо указать значение хотя бы для одного из параметров запроса ( as_epq , as_lq , as_oq , as_q) , чтобы получить результаты поиска.

Существует также ряд специальных терминов запроса, которые можно использовать в качестве части значения параметра q . Список и определения этих терминов см. в разделе «Специальные термины запроса» .

В панели управления поиском Google отображается отчет о наиболее часто используемых поисковых запросах, отправленных с использованием параметра q .

Примечание: значение, указанное для параметра q, должно быть экранировано в соответствии с URL-адресом.

Примеры q=vacation &as_oq=london+paris

безопасный
Описание

Необязательный параметр . Параметр safe указывает, как следует фильтровать результаты поиска на предмет контента для взрослых и порнографии. Значение по умолчанию для параметра safeoff . Допустимые значения параметра:

Ценить Действие
off Отключить безопасный поиск
medium Включить безопасный поиск
high Включить более строгую версию функции SafeSearch

Более подробную информацию об этой функции см. в разделе « Фильтрация контента для взрослых с помощью SafeSearch» .

Примеры q=adult&safe=high

начинать
Описание

Параметр start необязателен . Он указывает первый результат, соответствующий запросу, который должен быть включен в результаты поиска. Параметр start использует индексацию с нуля, то есть первый результат равен 0, второй — 1 и так далее.

Параметр start работает совместно с параметром num для определения того, какие результаты поиска следует вернуть. Обратите внимание, что для любого запроса будет возвращено не более 1000 результатов, даже если запросу соответствует более 1000 документов, поэтому установка значения start равным 1000 или более приведет к отсутствию результатов.

Примеры start=10

сортировка
Описание

Параметр sort необязателен . Он указывает, следует ли сортировать результаты в соответствии с указанным выражением. Например, сортировка по дате.

Примеры

sort=date


уд
Описание

Необязательный параметр. Параметр ud указывает, следует ли включать в XML-ответ URL-адрес результатов поиска в кодировке IDN. Кодировка IDN (международное доменное имя) позволяет отображать домены на локальных языках, например:

http://www.花井鮨.com

Допустимые значения для этого параметра: 1 (по умолчанию), что означает, что XML-результат должен включать URL-адреса в кодировке IDN, и 0 , что означает, что XML-результат не должен включать URL-адреса в кодировке IDN. Если параметр ud установлен на 1 , URL-адрес в кодировке IDN будет отображаться в теге UD в ваших XML-результатах.

Если параметр ud установлен на 0 , то URL-адрес из приведенного выше примера будет отображаться следующим образом:

http://www.xn--elq438j.com.

Примечание: это бета-версия функции.

Примеры q=google&ud=1

Дополнительные параметры запроса, перечисленные ниже изображения, относятся к расширенным поисковым запросам. При отправке расширенного поиска значения нескольких параметров (например, as_eq , as_epq , as_oq и т. д.) учитываются в поисковых запросах. На изображении показана страница расширенного поиска Google. На изображении название каждого параметра расширенного поиска написано красным текстом внутри или рядом с полем на странице, которому соответствует этот параметр.



Расширенные параметры поискового запроса

as_dt
Описание

Необязательный параметр. Параметр as_dt определяет, следует ли включать или исключать результаты с сайта, указанного в параметре as_sitesearch . Значения i и e обозначают включение и исключение соответственно.

Примеры as_dt=i,as_dt=e

as_epq
Описание

Параметр as_epq является необязательным . Он определяет фразу, которую должны содержать все документы в результатах поиска. Для поиска фразы также можно использовать поисковый запрос по фразе.

Примеры as_epq=abraham+lincoln

as_eq
Описание

Необязательный параметр. Параметр as_eq определяет слово или фразу, которые не должны появляться ни в одном документе в результатах поиска. Вы также можете использовать параметр exclude query term, чтобы гарантировать, что определенное слово или фраза не будут появляться в документах в наборе результатов поиска.

Примеры

q=bass&as_eq=music .


as_lq
Описание

Параметр as_lq необязателен . Он указывает, что все результаты поиска должны содержать ссылку на определенный URL-адрес. Для этого типа запроса также можно использовать поисковый запрос link :.

Примеры

as_lq=www.google.com


as_nlo
Описание

Необязательный параметр. Параметр as_nlo задает начальное значение для диапазона поиска. Используйте as_nlo и as_nhi , чтобы добавить к запросу диапазон поиска, включающий значения as_nlo...as_nhi .

Примеры

Ниже задан диапазон поиска от 5 до 10 включительно:

as_nlo=5&as_nhi=10

as_nhi
Описание

Необязательный параметр. Параметр as_nhi задает конечное значение для диапазона поиска. Используйте as_nlo и as_nhi , чтобы добавить к запросу диапазон поиска, включающий значения as_nlo...as_nhi .

Примеры

Ниже задан диапазон поиска от 5 до 10 включительно:

as_nlo=5&as_nhi=10

as_oq
Описание

Параметр as_oq необязателен . Он задает дополнительные поисковые запросы для проверки в документе, при этом каждый документ в результатах поиска должен содержать хотя бы один из дополнительных поисковых запросов. Для этого типа запроса также можно использовать логический оператор OR .

Примеры

q=vacation&as_oq=London+Paris


as_q
Описание

Параметр as_q является необязательным . Он задает поисковые запросы для проверки наличия терминов в документе. Этот параметр также часто используется для указания дополнительных терминов для поиска в результатах поиска.

Примеры

q=president&as_q=John+Adams


as_qdr
Описание

Необязательный параметр. Параметр as_qdr запрашивает результаты поиска за указанный период времени (быстрый диапазон дат). Поддерживаются следующие значения:

d[number] запрашивает результаты за указанное количество прошлых дней.
w[number] запрашивает результаты за указанное количество прошлых недель.
m[number] запрашивает результаты за указанное количество прошлых месяцев.
y[number] запрашивает результаты за указанное количество прошлых лет.

Примеры

В этом примере запрашиваются результаты за прошедший год:

as_qdr=y

В этом примере запрашиваются результаты за последние 10 дней:

as_qdr=d10

as_sitesearch
Описание

Необязательный параметр. Параметр as_sitesearch позволяет указать, что все результаты поиска должны быть страницами с заданного сайта. Установив параметр as_dt , вы также можете использовать его для исключения страниц с заданного сайта из результатов поиска.

Примеры

q=vacation&as_sitesearch=www.google.com


Специальные термины запроса

Поисковая система Google WebSearch позволяет использовать несколько специальных поисковых запросов, которые предоставляют доступ к дополнительным возможностям поисковой системы Google. Эти специальные поисковые запросы должны быть включены в значение параметра запроса q . Как и другие поисковые запросы, специальные поисковые запросы должны быть экранированы в URL-адресе . Ряд специальных поисковых запросов содержит двоеточие (:). Этот символ также должен быть экранирован в URL-адресе; его значение в URL-адресе — %3A .

Обратные ссылки [ссылка:]
Описание

Поисковый запрос link: позволяет получить набор веб-страниц, которые ссылаются на определенный URL. Поисковый запрос должен быть отформатирован как link:URL без пробела между поисковым запросом link: и URL.

Версия link:link%3A .

Также вы можете использовать параметр запроса as_lq для отправки запроса на добавление link: .

Примечание: При использовании link: нельзя указывать другие поисковые запросы.

Примеры

http://www.google.com/search? q=link%3Awww.example.com


Логический поиск ИЛИ [ ИЛИ ]
Описание

Поисковый запрос с оператором OR позволяет получить документы, содержащие один из ряда (двух или более) поисковых терминов. Для использования запроса с оператором OR необходимо вставить поисковый термин OR , написанный заглавными буквами, между каждым термином в ряду.

Также вы можете использовать параметр запроса as_oq для отправки запроса на поиск любого термина в заданном наборе терминов.

Примечание: Если в поисковом запросе указана последовательность слов "Лондон+ИЛИ+Париж", результаты поиска будут включать документы, содержащие хотя бы одно из этих двух слов. В некоторых случаях документы в результатах поиска могут содержать оба слова.

Примеры

Найдите Лондон или Париж:

Ввод пользователя: london OR paris Поисковый запрос: q=london+OR+paris

Найдите вариант отдыха, указав Лондон или Париж:

Поисковый запрос: q=vacation+london+OR+paris

Найдите в поиске варианты отдыха, например, Лондон, Париж или шоколад:

Поисковый запрос: q=vacation+london+OR+paris+OR+chocolates

Поиск по запросам «отдых» и «шоколад» должен начинаться с Лондона или Парижа, при этом наименьший вес должен быть отдан шоколаду:

Поисковый запрос: q=vacation+london+OR+paris+chocolates

Найдите в документах, содержащих слова «Лондон» или «Париж», упоминания о каникулах, шоколаде и цветах:

Поисковый запрос: q=vacation+london+OR+paris+chocolates+flowers

Поищите варианты отдыха, например, в Лондоне или Париже, а также поищите шоколад или цветы:

Поисковый запрос: q=vacation+london+OR+paris+chocolates+OR+flowers

Исключить термин запроса [-]
Описание

Исключение ( - ) в поисковом запросе ограничивает результаты поиска документами, которые не содержат определенного слова или фразы. Для использования исключения в поисковом запросе перед словом или фразой, которую необходимо исключить из списка соответствующих документов, следует поставить знак "-" (минус).

Версия символа "-" в формате URL-экранирования - %2D .

Исключение поискового запроса полезно, когда поисковый запрос имеет несколько значений. Например, слово «басс» может выдавать результаты либо о рыбе, либо о музыке. Если вы ищете документы о рыбе, вы можете исключить документы о музыке из результатов поиска, используя исключение поискового запроса.

Также можно использовать параметр запроса as_eq для исключения из результатов поиска документов, соответствующих определенному слову или фразе.

Примеры Ввод пользователя: bass -music
Поисковый запрос: q=bass+ %2Dmusic

Исключение типов файлов [ -filetype: ]
Описание

Параметр запроса -filetype: исключает из результатов поиска документы с определенным расширением файла, например ".pdf" или ".doc". Поисковый запрос должен быть отформатирован как -filetype:EXTENSION без пробела между параметром запроса -filetype: и указанным расширением.

Версия параметра -filetype: экранированная в формате URL, — %2Dfiletype%3A .

Примечание: Вы можете исключить несколько типов файлов из результатов поиска, добавив в свой запрос несколько терминов -filetype: Для каждого расширения файла, которое следует исключить из результатов поиска, в вашем поисковом запросе должен быть один термин -filetype:

В число поддерживаемых Google типов файлов входят:

  • Формат переносимых документов Adobe (pdf)
  • Adobe PostScript (ps)
  • Lotus 1-2-3 (1-я неделя, 2-я неделя, 3-я неделя, 4-я неделя, 5-я неделя, неделя, неделя, неделя)
  • Lotus WordPro (lwp)
  • Macwrite (mw)
  • Microsoft Excel (xls)
  • Microsoft PowerPoint (ppt)
  • Microsoft Word (doc)
  • Microsoft Works (wks, wps, wdb)
  • Microsoft Write (wri)
  • Формат форматированного текста (RTF)
  • Shockwave Flash (swf)
  • Текст (ans, txt).

В будущем могут быть добавлены новые типы файлов. Актуальный список всегда можно найти в разделе часто задаваемых вопросов (FAQ) о типах файлов на сайте Google.

Примеры

В этом примере возвращаются документы, в которых упоминается «Google», но которые не являются PDF-документами:
q=Google+ %2Dfiletype%3Apdf

В этом примере отображаются документы, в которых упоминается «Google», но исключаются документы в формате PDF и Word:
q=Google+ %2Dfiletype%3Apdf+%2Dfiletype%3Adoc


Фильтрация по типу файла [ ​​filetype: ]
Описание

Поисковый запрос filetype: ограничивает результаты поиска документами с определенным расширением файла, например, ".pdf" или ".doc". Поисковый запрос должен быть отформатирован как filetype:EXTENSION без пробела между поисковым запросом filetype: и указанным расширением.

Версия filetype: экранированная в URL-адресе, — filetype%3A .

Вы можете ограничить результаты поиска документами, соответствующими одному из нескольких расширений файлов, добавив в свой запрос несколько ключевых слов filetype: В вашем поисковом запросе должно быть одно ключевое слово типа filetype: для каждого расширения файла, которое должно быть включено в результаты поиска. Несколько ключевых слов типа файла filetype: должны быть разделены оператором OR .

По умолчанию в результаты поиска будут включены документы с любым расширением файла.

В число поддерживаемых Google типов файлов входят:

  • Формат переносимых документов Adobe (pdf)
  • Adobe PostScript (ps)
  • Lotus 1-2-3 (1-я неделя, 2-я неделя, 3-я неделя, 4-я неделя, 5-я неделя, неделя, неделя, неделя)
  • Lotus WordPro (lwp)
  • Macwrite (mw)
  • Microsoft Excel (xls)
  • Microsoft PowerPoint (ppt)
  • Microsoft Word (doc)
  • Microsoft Works (wks, wps, wdb)
  • Microsoft Write (wri)
  • Формат форматированного текста (RTF)
  • Shockwave Flash (swf)
  • Текст (ans, txt).

В будущем могут быть добавлены новые типы файлов. Актуальный список всегда можно найти в разделе часто задаваемых вопросов (FAQ) о типах файлов на сайте Google.

Примеры

В этом примере возвращаются PDF-документы, в которых упоминается «Google»:
q=Google+ filetype%3Apdf

В этом примере возвращаются PDF- и Word-документы, в которых упоминается "Google":
q=Google+ filetype%3Apdf+OR+filetype%3Adoc


Включить поисковый запрос [+]
Описание

Включенный (+) поисковый запрос указывает, что слово или фраза должны встречаться во всех документах, включенных в результаты поиска. Для использования включенного поискового запроса перед словом или фразой, которая должна присутствовать во всех результатах поиска, следует поставить знак "+" (плюс).

В URL-формате символ + (плюс) экранируется как %2B .

Перед распространенным словом, которое Google обычно игнорирует при определении результатов поиска, следует использовать + .

Примеры Ввод пользователя: Star Wars Episode +I
Поисковый запрос: q=Star+Wars+Episode+ %2BI

Поиск только по ссылкам, все термины [ allinlinks: ]
Описание

Поисковый запрос allinlinks: требует, чтобы документы в результатах поиска содержали все слова поискового запроса в виде URL-ссылок. Поисковый запрос должен быть отформатирован следующим образом allinlinks: за которым следуют слова из вашего поискового запроса.

Если ваш поисковый запрос содержит ключевое слово allinlinks: Google будет проверять URL-ссылки в документах только на наличие слов из вашего поискового запроса, игнорируя остальной текст в документах, заголовки документов и URL-адреса каждого документа. Обратите внимание, что URL-адрес документа отличается от URL-адресов ссылок, содержащихся в документе.

Версия allinlinks: экранированная в URL-адресе, — allinlinks%3A .

Примеры Ввод пользователя: allinlinks: Google search
Поисковый запрос: q= allinlinks%3A+Google+search

Поиск по фразе
Описание

Поиск по фразе (") позволяет искать целые фразы, заключая их в кавычки или соединяя дефисами.

Версия символа " (кавычка) в формате URL-экранирования — %22 .

Поиск по фразам особенно полезен, если вы ищете известные цитаты или имена собственные.

Также вы можете использовать параметр запроса as_epq для отправки запроса на поиск по фразе.

Примеры Ввод пользователя: "Abraham Lincoln"
Поисковый запрос: q= %22Abraham+Lincoln%22


Информация о веб-документе [info:]
Описание

Поисковый запрос info: извлекает общую информацию об URL-адресе, если этот URL-адрес включен в поисковый индекс Google. Поисковый запрос должен быть отформатирован как info:URL без пробела между поисковым запросом info: и URL-адресом.

Версия info: экранированная в URL-адресе, — info%3A .

Примечание: При использовании info:

Примеры Ввод пользователя: info:www.google.com
Поисковый запрос: q= info%3Awww.google.com

Примеры запросов изображений

Приведенные ниже примеры демонстрируют несколько HTTP-запросов к изображениям, чтобы показать, как используются различные параметры запроса. Определения различных параметров запроса приведены в разделах «Определения параметров запроса к изображениям» этого документа.

Этот запрос запрашивает первые 5 результатов ( start=0&num=5 ) по поисковому запросу "monkey" ( q=monkey ) с типом файла .png. Наконец, запрос задает значения для параметров client , output и cx , все три из которых являются обязательными.

http://www.google.com/cse?
  searchtype=image
  start=0
  &num=5
  &q=monkey
  &as_filetype=png
  &client=google-csbe
  &output=xml_no_dtd
  &cx=00255077836266642015:u-scht7a-8i

Параметры запроса для поиска изображений

as_filetype
Описание

Необязательный параметр . Возвращает изображения указанного типа. Допустимые значения: bmp , gif , png , jpg и svg .

Примеры q=google&as_filetype=png

imgsz
Описание

Необязательный параметр . Возвращает изображения указанного размера, где размер может быть одним из следующих:

  • icon (маленький)
  • small|medium|large|xlarge (средний)
  • xxlarge (большой)
  • huge (очень большой)

Примеры q=google&as_filetype=png&imgsz=icon

imgtype
Описание

Необязательный параметр . Возвращает изображения определенного типа, который может быть одним из следующих:

  • clipart (clipart)
  • face (лицо)
  • lineart (лайнарт)
  • news (новости)
  • photo (фото)

Примеры q=google&as_filetype=png&imgtype=photo

imgc
Описание

Необязательный параметр . Возвращает черно-белые, полутоновые или цветные изображения:

  • mono (черно-белый)
  • gray (оттенки серого)
  • color (цвет)

Примеры q=google&as_filetype=png&imgc=gray

imgcolor
Описание

Необязательный параметр . Возвращает изображения определенного доминирующего цвета:

  • yellow
  • green
  • teal
  • blue
  • purple
  • pink
  • white
  • gray
  • black
  • brown
Примеры q=google&as_filetype=png&imgcolor=yellow

as_rights
Описание

Необязательный параметр . Фильтры на основе лицензирования. Поддерживаемые значения:

  • cc_publicdomain
  • cc_attribute
  • cc_sharealike
  • cc_noncommercial
  • cc_nonderived

Примеры q=cats&as_filetype=png&as_rights=cc_attribute

Ограничения на запросы

В таблице ниже перечислены ограничения на поисковые запросы, которые вы отправляете в Google:

Компонент Лимит Комментарий
длина поискового запроса 2048 байт
Количество поисковых запросов 10 включает термины в следующих параметрах: q , as_epq , as_eq , as_lq , as_oq , as_q
Количество результатов 20 Если установить параметр num равным числу больше 20, будет возвращено только 20 результатов. Для получения большего количества результатов потребуется отправить несколько запросов и увеличивать значение параметра start с каждым запросом.

Интернационализация запросов и презентация результатов

Сервис Google WebSearch позволяет искать документы на нескольких языках. Вы можете указать кодировку символов, которая должна использоваться для интерпретации вашего HTTP-запроса и кодирования вашего XML-ответа (используя параметры поиска ie и oe ). Вы также можете отфильтровать результаты, чтобы включить только документы, написанные на определенных языках.

В следующих разделах рассматриваются вопросы, связанные с поиском на нескольких языках:

Кодировка символов

Серверы отправляют данные, такие как веб-страницы, пользовательским агентам, например браузерам, в виде последовательности закодированных байтов. Затем пользовательский агент декодирует эти байты в последовательность символов. При отправке запросов к службе WebSearch вы можете указать схемы кодирования как для вашего поискового запроса, так и для получаемого XML-ответа.

Параметр запроса ie позволяет указать механизм кодирования символов в HTTP-запросе. Параметр oe также позволяет указать схему кодирования, которую Google должен использовать для кодирования вашего XML-ответа. Если вы используете схему кодирования, отличную от ISO-8859-1 (или latin1 ), убедитесь, что вы указали правильные значения для параметров ie и oe .

Примечание: Если вы предоставляете функцию поиска по нескольким языкам, мы рекомендуем использовать значение кодировки utf8 (UTF-8) как для параметров ie , так и для oe .

Полный список значений, которые можно использовать для параметров ie и oe , приведен в приложении « Схемы кодирования символов» .

Для получения более общей информации о кодировке символов, пожалуйста, посетите http://www.w3.org/TR/REC-html40/charset.html .

Языки интерфейса

Параметр запроса hl можно использовать для определения языка графического интерфейса. Значение параметра hl может влиять на результаты поиска XML, особенно при международных запросах, когда ограничение по языку (с помощью параметра lr ) явно не указано. В таких случаях параметр hl может отображать результаты поиска на том же языке, что и язык ввода пользователя.

Мы рекомендуем явно указывать параметр hl в результатах поиска, чтобы гарантировать, что Google будет выбирать наиболее качественные результаты поиска для каждого запроса.

Полный список допустимых значений параметра hl см. в разделе « Поддерживаемые языки интерфейса» .

Поиск документов, написанных на определенных языках.

С помощью параметра запроса lr можно ограничить результаты поиска документами, написанными на определенном языке или наборе языков.

Параметр lr поддерживает логические операторы , позволяющие указывать несколько языков, которые должны быть включены (или исключены) из результатов поиска.

Следующие примеры показывают, как можно использовать логические операторы для запроса документов на разных языках.

Для документов, написанных на японском языке:

lr=lang_jp

Для документов, написанных на итальянском или немецком языке:

lr=lang_it|lang_de

Для документов, составленных не на венгерском или чешском языке:

lr=(-lang_hu).(-lang_cs)

Полный список возможных значений параметра lr см. в разделе « Значения языковой коллекции» , а подробное описание использования этих операторов — в разделе «Логические операторы» .

Упрощенный китайский и традиционный китайский — это два варианта письменности китайского языка. Одно и то же понятие может быть записано по-разному в каждом из вариантов. При запросе, выполненном на одном из вариантов, сервис Google WebSearch может вернуть результаты, включающие страницы на обоих вариантах.

Для использования этой функции:

  1. Установите параметр запроса c2coff равным 0.
    и
  2. Выполните одно из следующих действий:
    • Не задавайте параметр запроса lr.
      или
    • Установите параметр запроса lr следующим образом: lr=lang_zh-TW|lang_zh-CN

В следующем примере показаны параметры запроса, которые следует включить в запрос на получение результатов как на упрощенном, так и на традиционном китайском языке. (Обратите внимание, что дополнительная обязательная информация, такая как клиент , в примере не включена.)

search?hl=zh-CN
    &lr=lang_zh-TW|lang_zh-CN
    &c2coff=0

Фильтрация результатов

Поисковая система Google WebSearch предоставляет несколько способов фильтрации результатов поиска:

Автоматическая фильтрация результатов поиска

Стремясь предоставить наилучшие результаты поиска, Google использует два метода для автоматической фильтрации результатов поиска, которые обычно считаются нежелательными:

  • Дублирование контента — Если несколько документов содержат одну и ту же информацию, то в результаты поиска будет включен только наиболее релевантный документ из этого набора.

  • Перегрузка хоста — Если результатов поиска с одного и того же сайта много, Google может не показывать все результаты с этого сайта или показывать результаты ниже.
    их рейтинг был бы выше, чем в противном случае.

Мы рекомендуем оставлять эти фильтры включенными для стандартных поисковых запросов, поскольку они значительно повышают качество большинства результатов поиска. Однако вы можете обойти эти автоматические фильтры, установив параметр запроса filter равным 0 в вашем поисковом запросе.

Фильтрация по языку и стране

Сервис Google WebSearch возвращает результаты из главного индекса всех веб-документов. Главный индекс содержит подколлекции документов, сгруппированные по определенным атрибутам, включая язык и страну происхождения.

С помощью параметров запроса lr и cr можно ограничить результаты поиска подгруппами документов, написанных на определенных языках или происходящих из определенных стран, соответственно.

Поисковая система Google определяет язык документа, анализируя следующие данные:

  • домен верхнего уровня (TLD) URL-адреса документа
  • языковые метатеги в документе
  • основной язык, используемый в основном тексте документа


Для получения дополнительной информации об ограничении результатов поиска по языку, пожалуйста, ознакомьтесь также с определением параметра lr , разделом «Поиск документов, написанных на определенных языках» и списком языковых значений , которые можно использовать в качестве значений для параметра lr .

Поисковая система Google определяет страну документа, анализируя следующие данные:

  • домен верхнего уровня (TLD) URL-адреса документа
  • географическое местоположение IP-адреса веб-сервера

Для получения дополнительной информации об ограничении результатов по стране происхождения, пожалуйста, ознакомьтесь также с определением параметра cr и значениями для сбора данных по странам , которые можно использовать в качестве значений для параметра cr .

Note: You can combine language values and country values to customize your search results. For example, you could request documents that are written in French and come from France or Canada, or you could request documents that come from Holland and are not written in English. The lr and cr parameters both support Boolean Operators .

Filtering Adult Content with SafeSearch

Many Google customers do not want to display search results for sites that contain adult content. Using our SafeSearch filter, you can screen for search results that contain adult content and eliminate them. Google's filters use proprietary technology to check keywords, phrases and URLs. While no filters are 100 percent accurate, SafeSearch will remove the overwhelming majority of adult content from your search results.

Google strives to keep SafeSearch as current and comprehensive as possible by continually crawling the Web and by incorporating updates from user suggestions.

SafeSearch is available in the following languages:

Голландский
Английский
Французский
немецкий
итальянского
Португальский (бразильский)
испанский
Традиционный китайский

You can adjust the degree to which Google filters your results for adult content using the safe query parameter. The following table explains Google's SafeSearch settings and how those settings will affect your search results:

SafeSearch Level Описание
высокий Enables a stricter version of safe search.
середина Blocks web pages containing pornography and other explicit sexual content.
выключенный Does not filter adult content from search results.

* The default SafeSearch setting is off .

If you have SafeSearch activated and you find sites that contain offensive content in your results, please email the site's URL to safesearch@google.com , and we will investigate the site.

XML Results

Google XML Results DTD

Google uses the same DTD to describe the XML format for all types of search results. Many of the tags and attributes are applicable for all search types. Some tags, however, are applicable only for certain search types. Consequently, the definitions in the DTD may be less restrictive than the definitions given in this document.

This document describes those aspects of the DTD that are relevant for WebSearch. When you look at the DTD, if you're working on WebSearch, you can safely ignore tags and attributes that are not documented here. If the definition differs between the DTD and the documentation, that fact is noted in this document.

Google can return XML results either with or without a reference to the most recent DTD. The DTD is a guide to help search administrators and XML parsers understand Google's XML results. Because Google's XML grammar may change from time to time, you should not configure your parser to use the DTD to validate each XML result.

Additionally, you should not configure your XML parser to fetch the DTD each time you submit a search request. Google updates the DTD infrequently, and these requests create unnecessary delay and bandwidth requirements.

Google recommends that you use the xml_no_dtd output format to get XML results. If you specify the xml output format in your search request, the only difference is the inclusion of the following line in the XML results:

<!DOCTYPE GSP SYSTEM "google.dtd">

You can access the latest DTD at http://www.google.com/google.dtd .

Please note that not all features in the DTD may be available or supported at this time.

About the XML Response

  • All element values are valid HTML suitable for display unless otherwise noted in the XML tag definitions.
  • Some element values are URLs that need to be HTML-encoded before they are displayed.
  • Your XML parser should ignore undocumented attributes and tags. This allows your application to continue working without modification if Google adds more features to the XML output.
  • Certain characters must be escaped when included as values in XML tags. Your XML processor should convert these entities back to the appropriate characters. If you do not convert entities properly, the browser may, for example, render the & character as "&amp;". The XML Standard documents these characters; these characters are reproduced in the table below:

    Характер Escaped Forms Сущность Код символа
    Амперсанд & &amp; &#38;
    Одна цитата ' &apos; &#39;
    Двойная цитата " " &#34;
    Больше, чем > > &#62;
    Меньше, чем < < &#60;

XML Results for Regular and Advanced Search Queries

Regular/Advanced Search: Sample Query and XML Result

This sample WebSearch request asks for 10 results ( num=10 ) about the search term "socer" ( q=socer ), which is the word "soccer" intentionally spelled wrong for this example.)

http://www.google.com/search?
q=socer
&hl=en
&start=10
&num=10
&output=xml
&client=google-csbe
&cx=00255077836266642015:u-scht7a-8i

This request yields the XML result below. Note that there are several comments in the XML result to indicate where certain tags not included in the result would appear.

<?xml version="1.0" encoding="ISO-8859-1" standalone="no" ?>

<GSP VER="3.2">
<TM>0.452923</TM>
<Q>socer</Q>
<PARAM name="cx" value="00255077836266642015:u-scht7a-8i" original_value="00255077836266642015%3Au-scht7a-8i"/>
<PARAM name="hl" value="en" original_value="en"/>
<PARAM name="q" value="socer" original_value="socer"/>
<PARAM name="output" value="xml" original_value="xml"/>
<PARAM name="client" value="google-csbe" original_value="google-csbe"/>
<PARAM name="num" value="10" original_value="10"/>
<Spelling>
<Suggestion q="soccer"><b><i>soccer</i></b></Suggestion>
</Spelling>
<Context>
<title>Sample Vacation CSE</title>
<Facet>
<FacetItem>
<label>restaurants</label>
<anchor_text>restaurants</anchor_text>
</FacetItem>
<FacetItem>
<label>wineries</label>
<anchor_text>wineries</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>golf_courses</label>
<anchor_text>golf courses</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>hotels</label>
<anchor_text>hotels</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>nightlife</label>
<anchor_text>nightlife</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>soccer_sites</label>
<anchor_text>soccer sites</anchor_text>
</FacetItem>
</Facet>
</Context>
<RES SN="1" EN="10">
<M>6080</M>
/*
* The FI tag after the comment indicates that the result
* set has been filtered. If the number of results were exact, the
* FI tag would be replaced by an XT tag in the same format.
*/

<FI />
<NB>
/*
* Since the request is for the first page of results, the PU tag,
* which contains a link to the previous page of search results,
* is not included in this XML result. If the sample result did include
* a previous page of results, it would be listed here, in the same format
* as the NU tag on the following line
*/

<NU>/search?q=socer&hl=en&lr=&ie=UTF-8&output=xml&client=test&start=10&sa=N</NU>
</NB>
<R N="1">
<U>http://www.soccerconnection.net/</U>
<UE>http://www.soccerconnection.net/</UE>
<T>SoccerConnection.net</T>
<CRAWLDATE>May 21, 2007</CRAWLDATE>
<S><b>soccer</b>; players; coaches; ball; world cup;<b>...</b></S>
<Label>transcodable_pages</Label>
<Label>accessible</Label>
<Label>soccer_sites</Label>
<LANG>en</LANG>
<HAS>
<DI>
<DT>SoccerConnection.net</DT>
<DS>Post your <b>soccer</b> resume directly on the Internet.</DS>
</DI>
<L/>
<C SZ="8k" CID="kWAPoYw1xIUJ"/>
<RT/>
</HAS>
</R>
/*
* The result includes nine more results, each enclosed by an R tag.
*/

</RES>
</GSP>

Regular/Advanced Search: XML Tags

XML responses for regular search requests and advanced search requests both use the same set of XML tags. These XML tags are shown in the XML example above and explained in the tables below.

The XML tags below are listed alphabetically by tag name, and each tag definition contains a description of the tag, an example showing how the tag would appear in an XML result and the format of the tag's content. If the tag is a subtag of another XML tag or if the tag has subtags or attributes of its own, that information is also provided in the tag's definition table.

Certain symbols may be displayed next to some subtags in the definitions below. These symbols, and their meanings, are:

? = optional subtag
* = zero or more instances of the subtag
+ = one or more instances of the subtag
А Б С Д Ф Г ЧАС я Л М Н П В Р С Т У X

anchor_text
Определение

The <anchor_text> tag specifies the text that you should display to users to identify a refinement label associated with a search result set. Since refinement labels replace nonalphanumeric characters with underscores, you should not display the value of the <label> tag in your user interface. Instead, you should display the value of the <anchor_text> tag.

Пример <anchor_text>golf courses</anchor_text>
Subtag of FacetItem
Формат контента Текст

БЛОКИРОВАТЬ
Определение

This tag encapsulates the contents of a block in a body line of a promotion result. Each block has subtags T , U , and L . A nonempty T tag denotes that the block contains text; nonempty U and L tags denote that the block contains a link (with URL given in the U subtag and anchor text in the L subtag).

Подтеги T , U , L
Subtag of BODY_LINE
Формат контента Пустой

BODY_LINE
Определение

This tag encapsulates the contents of a line in the body of promoted result. Each body line consists of several BLOCK tags, which either contain some text or a link with URL and anchor text.

Подтеги БЛОКИРОВАТЬ *
Subtag of SL_MAIN
Формат контента Пустой

С
Определение

The <C> tag indicates that the WebSearch service can retrieve a cached version of this search result URL. You cannot retrieve cached pages through the XML API, but you can redirect users to www.google.com for this content.

Атрибуты
Имя Формат Описание
СЗ Text (Integer + "k") Provides the size of the cached version of the search result in kilobytes ("k").
CID Текст Identifies a document in Google's cache. To fetch the document from the cache, send a search term built as follows:
cache: CIDtext : escapedURL

The escaped URL is available in the UE tag.

Пример <C SZ="6k" CID="kvOXK_cYSSgJ" />
Subtag of ИМЕЕТ
Формат контента Пустой

C2C
Определение The <C2C> tag indicates that the result refers to a Traditional Chinese language page. This tag appears only when Simplified and Traditional Chinese Search is enabled. See the c2coff query parameter definition for more information about enabling and disabling this feature.
Формат контента Текст

Контекст
Определение

The <Context> tag encapsulates a list of refinement labels associated with a set of search results.

Пример <Контекст>
Подтеги title , Facet +
Формат контента Контейнер

CRAWLDATE
Определение

The <CRAWLDATE> tag identifies the date that the page was last crawled. CRAWLDATE is not returned for every search result page.

Пример <CRAWLDATE>May 21, 2005</CRAWLDATE>
Subtag of Р
Формат контента Текст

ДИ
Определение

The <DI> tag encapsulates Open Directory Project (ODP) category information for a single search result.

Пример <DI>
Подтеги DT ?, DS ?
Subtag of ИМЕЕТ
Формат контента Пустой

ДС
Определение

The <DS> tag provides the summary listed for a single category in the ODP directory.

Пример <DS>Post your &lt;b&gt;soccer&lt;/b&gt; resume directly on the Internet.</DS>
Subtag of ДИ
Формат контента Text (may contain HTML)

ДТ
Определение

The <DT> tag provides the title for a single category listed in the ODP directory.

Пример <DT>SoccerConnection.net</DT>
Subtag of ДИ
Формат контента Text (may contain HTML)

Фасет
Определение

The <Facet> tag contains a logical grouping of <FacetItem> tags. You can create these groupings using the Programmable Search Engine Engine XML Specification format . If you do not create these groupings, the results_xml_tag_Context><Context> tag will contain up to four <Facet> tags. The items within each <Facet> tag will be grouped for display purposes but may not have a logical relationship.

Пример <Facet>
Подтеги FacetItem +, title +
Subtag of Контекст
Формат контента Контейнер

FacetItem
Определение

The <FacetItem> tag encapsulates information about a refinement label associated with a set of search results.

Пример <FacetItem>
Подтеги label , anchor_text +
Subtag of Фасет
Формат контента FacetItem

ФИ
Определение The <FI> tag serves as a flag that indicates whether document filtering was performed for the search. See the Automatic Filtering section of this document for more information about Google's search results filters.
Пример <FI />
Subtag of РЕЗ
Формат контента Пустой

ГСП
Определение

The <GSP> tag encapsulates all data returned in Google XML search results. "GSP" is an abbreviation for "Google Search Protocol".

Атрибуты
Имя Формат Описание
ВЕР Text (Integer) The VER attribute specifies the version of the search results output. The current output version is "3.2".
Пример <GSP VER="3.2">
Подтеги PARAM +, Q , RES ?, TM
Формат контента Пустой

ИМЕЕТ
Определение The <HAS> tag encapsulates information about any special search request parameters supported for a particular URL.

Note: The definition of <HAS> for WebSearch is more restrictive than in the DTD .

Подтеги DI ?, L ?, C ?, RT ?
Subtag of Р

ИЗУРЛ
Определение Google returns the <ISURL> tag if the associated search query is a URL.
Subtag of ГСП
Формат контента Пустой

Л
Определение The presence of the <L> tag indicates that the WebSearch service can find other sites that link to this search result URL. To find such sites, you would use the link: special query term.
Subtag of ИМЕЕТ
Формат контента Пустой

этикетка
Определение

The <label> tag specifies a refinement label that you can use to filter the search results that you receive. To use a refinement label, add the string more: [[label tag value]] to the value of the q parameter in your HTTP request to Google as shown in the following example. Please note that this value must be URL-escaped before you send the query to Google.

This example uses the refinement label golf_courses to
filter search results about Palm Springs:
q=Palm+Springs+more:golf_courses

The URL-escaped version of this query is:
q=Palm+Springs+more%3Agolf_courses

Note: The <label> tag is not the same as the <Label> tag, which identifies a refinement label associated with a particular URL in your search results.

Пример <label>golf_courses</label>
Subtag of FacetItem
Формат контента Текст

ЛАНГ
Определение

The <LANG> tag contains Google's best guess of the language of the search result.

Пример <LANG>en</LANG>
Subtag of Р
Формат контента Текст

М
Определение

The <M> tag identifies the estimated total number of results for the search.

Note: This estimate may not be accurate.

Пример <M>16200000</M>
Subtag of РЕЗ
Формат контента Текст

НБ
Определение

The <NB> tag encapsulates navigation information—links to the next page of search results or the previous page of search results—for the result set.

Note: This tag is only present if more results are available.

Пример <NB>
Подтеги NU ?, PU ?
Subtag of РЕЗ
Формат контента Пустой

НУ
Определение

The <NU> tag contains a relative link to the next page of search results.

Пример <NU>/search?q=flowers&num=10&hl=en&ie=UTF-8
&output=xml&client=test&start=10</NU>
Subtag of НБ
Формат контента Text (Relative URL)

ПАРАМА
Определение

The <PARAM> tag identifies an input parameter submitted in the HTTP request associated with the XML result. Information about the parameter is contained in the tag attributes—name, value, original_value—and there will be one PARAM tag for each parameter submitted in the HTTP request.

Атрибуты
Имя Формат Описание
имя Текст Input parameter name.
ценить HTML HTML-formatted version of the input parameter value.
исходное_значение Текст Original URL-escaped version of the input parameter value.
Пример <PARAM name="cr" value="countryNZ" original_value="countryNZ" />
Subtag of ГСП
Формат контента Сложный

ПУ
Определение

The <PU> tag provides a relative link to the previous page of search results.

Пример <PU>/search?q=flowers&num=10&hl=en&output=xml
&client=test&start=10</PU>
Subtag of НБ
Формат контента Text (Relative URL)

В
Определение

The <Q> tag identifies the search query submitted in the HTTP request associated with the XML result.

Пример

<Q>pizza</Q>

Subtag of ГСП
Формат контента Текст

Р
Определение

The <R> tag encapsulates the details of an individual search result.

Note: The definition of the <R> tag for WebSearch is more restrictive than in the DTD .

Атрибуты
Имя Формат Описание
Н Text (Integer) Indicates the index (1-based) of this search result.
МИМЕ Текст Indicates the MIME type of the search result.
Подтеги U , UE , T ?, CRAWLDATE , S ?, LANG ?, HAS
Subtag of РЕЗ

РЕЗ
Определение

The <RES> tag encapsulates the set of individual search results and details about those results.

Атрибуты
Имя Формат Описание
СН Text (Integer) Indicates the index (1-based) of the first search result returned in this result set.
ЕН Text (Integer) Indicates the index (1-based) of the last search result returned in this result set.
Пример <RES SN="1" EN="10">
Подтеги M , FI ?, XT ?, NB ?, R *
Subtag of ГСП
Формат контента Пустой

С
Определение

The <S> tag contains an excerpt for a search result that shows query terms highlighted in bold. Line breaks are included in the excerpt for proper text wrapping.

Пример <S>Washington (CNN) -- A bid to end the Senate standoff over President &lt;b&gt;Bush&#39;s&lt;/b&gt; judicial picks would let five nominees advance to a final vote while preserving the &lt;b&gt;...&lt;b&gt;...&lt;/b&gt;<S>
Subtag of Р
Формат контента Text (HTML)

SL_MAIN
Определение

This tag encapsulates the contents of a promotion result. Use for parsing promotions. The anchor text and URL of the title link are contained in T and U subtags respectively. The lines of body text and links are contained in BODY_LINE subtags.

Подтеги BODY_LINE *, T , U
Subtag of SL_RESULTS
Формат контента Пустой

SL_RESULTS
Определение

Container tag for promoted results. One of these will appear whenever you have a promotion in your search results. The SL_MAIN subtag contains the main result data.

Подтеги SL_MAIN *
Subtag of Р
Формат контента Пустой

Написание
Определение

The <Spelling> tag encapsulates an alternate spelling suggestion for the submitted query. This tag only appears on the first page of search results. Spelling suggestions are available in English, Chinese, Japanese and Korean.

Note: Google will only return spelling suggestions for queries where the gl parameter value is in lowercase letters.

Пример <Spelling>
Подтеги Предположение
Subtag of ГСП
Формат контента Пустой

Предположение
Определение The <Suggestion> tag contains an alternate spelling suggestion for the submitted query. You can use the tag's content to suggest the alternate spelling to your search user. The value of the q attribute is the URL-escaped spelling suggestion that you can use as a query term.
Атрибуты
Имя Формат Описание
q Текст The q attribute specifies the URL-escaped version of the spelling suggestion.
Пример <Suggestion q="soccer">&lt;b&gt;&lt;i&gt;soccer&lt;/i&gt;&lt;/b&gt;</Suggestion>
Subtag of Написание
Формат контента Text (HTML)

Т
Определение The <T> tag contains the title of the result.
Пример <T>Amici's East Coast Pizzeria</T>
Subtag of Р
Формат контента Text (HTML)

заголовок
Определение

As a child of <Context> , the <title> tag contains the name of your Programmable Search Engine.

As a child of <Facet> , the <title> tag provides a title for a set of facets.

Пример

As a child of <Context>: <title>My Search Engine</title>

As a child of <Facet>: <title>facet title</title>

Subtag of Context , Facet
Формат контента Текст

Определение

The <TM> tag identifies the total server time needed to return search results, measured in seconds.

Пример <TM>0.100445</TM>
Subtag of ГСП
Формат контента Text (Floating-point number)

ТТ
Определение The <TT> tag provides a search tip.
Пример <TT>&lt;i&gt;Tip: For most browsers, pressing the Return key produces the same results as clicking the Search button.&lt;/i&gt;</TT>
Subtag of ГСП

У
Определение The <U> tag provides the URL of the search result.
Пример <U>http://www.dominos.com/</U>
Subtag of Р
Формат контента Text (Absolute URL)

УД
Определение

The <UD> tag provides the IDN-encoded (International Domain Name) URL for the search result. The value allows domains to be displayed using local languages. For example, the IDN-encoded URL http://www.%E8%8A%B1%E4%BA%95.com could be decoded and displayed as http://www.花井鮨.com . This <UD> tag will only be included in search results for requests that included the ud parameter.

Примечание: это бета-версия функции.

Пример <UD>http://www.%E8%8A%B1%E4%BA%95.com/</UD>
Subtag of Р
Формат контента Text (IDN-encoded URL)

UE
Определение The <UE> tag provides the URL of the search result. The value is URL-escaped so that it is suitable for passing as a query parameter in a URL.
Пример <UE>http://www.dominos.com/</UE>
Subtag of Р
Формат контента Text (URL-escaped URL)

XT
Определение The <XT> tag indicates that the estimated total number of results, as specified by the M tag, actually represents the exact total number of results. See the Automatic Filtering section of this document for more details.
Пример <XT />
Subtag of РЕЗ
Формат контента Пустой


XML Results for Image Search Queries

This sample Image request asks for 5 results (num=5) about the search term "monkey" (q=monkey).

http://www.google.com/cse?
  searchtype=image
  &num=2
  &q=monkey
  &client=google-csbe
  &output=xml_no_dtd
  &cx=00255077836266642015:u-scht7a-8i

This request yields the XML result below.

<GSP VER="3.2">
  <TM>0.395037</TM>
  <Q>monkeys</Q>

  <PARAM name="cx" value="011737558837375720776:mbfrjmyam1g" original_value="011737558837375720776:mbfrjmyam1g" url_<escaped_value="011737558837375720776%3Ambfrjmyam1g" js_escaped_value="011737558837375720776:mbfrjmyam1g"/>
  <PARAM name="client" value="google-csbe" original_value="google-csbe" url_escaped_value="google-csbe" js_escaped_value="google-csbe"/>
  <PARAM name="q" value="monkeys" original_value="monkeys" url_escaped_value="monkeys" js_escaped_value="monkeys"/>
  <PARAM name="num" value="2" original_value="2" url_escaped_value="2" js_escaped_value="2"/>
  <PARAM name="output" value="xml_no_dtd" original_value="xml_no_dtd" url_escaped_value="xml_no_dtd" js_escaped_value="xml_no_dtd"/>
  <PARAM name="adkw" value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" original_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" url_escaped_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" js_escaped_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A"/>
  <PARAM name="hl" value="en" original_value="en" url_escaped_value="en" js_escaped_value="en"/>
  <PARAM name="oe" value="UTF-8" original_value="UTF-8" url_escaped_value="UTF-8" js_escaped_value="UTF-8"/>
  <PARAM name="ie" value="UTF-8" original_value="UTF-8" url_escaped_value="UTF-8" js_escaped_value="UTF-8"/>
  <PARAM name="boostcse" value="0" original_value="0" url_escaped_value="0" js_escaped_value="0"/>

  <Context>
    <title>domestigeek</title>
  </Context>

  <ARES/>
  <RES SN="1" EN="2">
    <M>2500000</M>
    <NB>
      <NU>/images?q=monkeys&num=2&hl=en&client=google-csbe&cx=011737558837375720776:mbfrjmyam1g&boostcse=0&output=xml_no_dtd
        &ie=UTF-8&oe=UTF-8&tbm=isch&ei=786oTsLiJaaFiALKrPChBg&start=2&sa=N
      </NU>
    </NB>
    <RG START="1" SIZE="2"/>
      <R N="1" MIME="image/jpeg">
        <RU>http://www.flickr.com/photos/fncll/135465558/</RU>
        <U>
          http://farm1.static.flickr.com/46/135465558_123402af8c.jpg
        </U>
        <UE>
          http://farm1.static.flickr.com/46/135465558_123402af8c.jpg
        </UE>
        <T>Computer <b>Monkeys</b> | Flickr - Photo Sharing!</T>
        <RK>0</RK>
        <BYLINEDATE>1146034800</BYLINEDATE>
        <S>Computer <b>Monkeys</b> | Flickr</S>
        <LANG>en</LANG>
        <IMG WH="500" HT="305" IID="ANd9GcQARKLwzi-t4lpWi2AERV3kJb4ansaQzTn3MNDZR9fD_JDiktPKByKUBLs">
          <SZ>88386</SZ>
          <IN/>
        </IMG>
        <TBN TYPE="0" WH="130" HT="79" URL="http://t0.gstatic.com/images?q=tbn:ANd9GcQARKLwzi-
t4lpWi2AERV3kJb4ansaQzTn3MNDZR9fD_JDiktPKByKUBLs"/>
      </R>
      <R N="2" MIME="image/jpeg">
        <RU>
          http://www.flickr.com/photos/flickerbulb/187044366/
        </RU>
        <U>
          http://farm1.static.flickr.com/73/187044366_506a1933f4.jpg
        </U>
        <UE>
          http://farm1.static.flickr.com/73/187044366_506a1933f4.jpg
        </UE>
        <T>
          one. ugly. <b>monkey</b>. | Flickr - Photo Sharing!
        </T>
        <RK>0</RK>
        <BYLINEDATE>1152514800</BYLINEDATE>
        <S>one. ugly. <b>monkey</b>.</S>
        <LANG>en</LANG>
        <IMG WH="400" HT="481" IID="ANd9GcQ3Qom0bYbee4fThCQVi96jMEwMU6IvVf2b8K5vERKVw-
           EF4tQQnDDKOq0"><SZ>58339</SZ>
          <IN/>
        </IMG>
        <TBN TYPE="0" WH="107" HT="129" URL="http://t1.gstatic.com/images?q=tbn:ANd9GcQ3Qom0bYbee4fThCQ
          Vi96jMEwMU6IvVf2b8K5vERKVw-EF4tQQnDDKOq0"/>
      </R>
  </RES>
</GSP>

Image Search: XML Tags

The table below shows additional XML tags used in XML responses for image search queries.

Certain symbols may be displayed next to some subtags in the definitions below. These symbols, and their meanings, are:

? = optional subtag
* = zero or more instances of the subtag
+ = one or more instances of the subtag

РГ
Определение

The <RG> tag encloses the details of an individual image search result.

Атрибуты
Имя Формат Описание
Н Text (Integer) Indicates the index (1-based) of this search result.
МИМЕ Текст Indicates the MIME type of the search result.
Subtag of РЕЗ
РУ
Определение

The <RU tag> tag encloses details of each image search result.

Subtag of Р