Справочник XML-API

Эта страница относится к XML-версии API JSON пользовательского поиска, которая доступна только клиентам Google Site Search .

  1. Обзор
  2. Формат запроса программируемой поисковой системы
    1. Обзор запроса
    2. Условия запроса
    3. Параметры запроса
      1. Примеры запросов веб-поиска
      2. Определения параметров запроса WebSearch
      3. Расширенный поиск
      4. Параметры расширенного поискового запроса
      5. Специальные условия запроса
      6. Примеры запросов изображений
      7. Параметры запроса поиска изображений
      8. Ограничения запросов
    4. Интернационализация запросов и представление результатов
      1. Кодировка символов
      2. Языки интерфейса
      3. Упрощенный и традиционный китайский поиск
    5. Фильтрация результатов
      1. Автоматическая фильтрация результатов поиска
      2. Фильтрация по языку и стране
      3. Фильтрация контента для взрослых с помощью Безопасного поиска
  3. Результаты XML
    1. DTD результатов Google XML
    2. Об ответе XML
    3. Результаты XML для обычных, графических и расширенных поисковых запросов
      1. Обычный/расширенный поиск: пример запроса и результат XML
      2. Обычный/расширенный поиск: XML-теги
      3. XML-результаты для поисковых запросов изображений
      4. Поиск изображений: пример запроса и результат XML
      5. Поиск изображений: XML-теги

Обзор

Служба Google WebSearch позволяет клиентам Google Site Search отображать результаты поиска Google на своих веб-сайтах. Служба WebSearch использует простой протокол на основе HTTP для предоставления результатов поиска. Администраторы поиска имеют полный контроль над тем, как они запрашивают результаты поиска и как они представляют эти результаты конечному пользователю. В этом документе описаны технические детали поискового запроса Google и форматы результатов.

Чтобы получить результаты Google WebSearch, ваше приложение отправляет Google простой HTTP-запрос. Затем Google возвращает результаты поиска в формате XML. Результаты в формате XML дают вам возможность настроить способ отображения результатов поиска.

Формат запроса веб-поиска

Обзор запроса

Поисковый запрос Google представляет собой стандартную команду HTTP GET . Он включает в себя набор параметров, соответствующих вашим запросам. Эти параметры включаются в URL-адрес запроса в виде пар имя=значение, разделенных символами амперсанда (&). Параметры включают в себя такие данные, как поисковый запрос и уникальный идентификатор механизма ( cx ), который идентифицирует механизм, отправляющий HTTP-запрос. Служба веб-поиска или поиска изображений возвращает результаты XML в ответ на ваши HTTP-запросы.

Условия запроса

Большинство поисковых запросов включают одно или несколько условий запроса. Термин запроса отображается как значение параметра в поисковом запросе.

Условия запроса могут указывать несколько типов информации для фильтрации и систематизации результатов поиска, возвращаемых Google. В запросах можно указать:

  • Слова или фразы , которые нужно включить или исключить
    • Все слова в поисковом запросе (по умолчанию)
    • Точная фраза в поисковом запросе
    • Любое слово или фраза в поисковом запросе
  • Где в документе искать условия поиска
    • В любом месте документа (по умолчанию)
    • Только в теле документа
    • Только в заголовке документа
    • Только в URL документа
    • Только в ссылках в документе
  • Ограничения на сами документы
    • Включение или исключение документов определенных типов файлов (например, файлов PDF или документов Word).
  • Специальные URL-запросы , которые возвращают информацию о данном URL-адресе, а не выполняют поиск.
    • Запросы, возвращающие общую информацию об URL-адресе, например его категорию Open Directory, фрагмент или язык.
    • Запросы, возвращающие набор веб-страниц, ссылающихся на URL-адрес.
    • Запросы, возвращающие набор веб-страниц, похожих на заданный URL-адрес.

Поиск по умолчанию

Значения параметров поискового запроса должны быть экранированы URL-адресом. Обратите внимание, что вы должны заменить знак плюса («+») на любые последовательности пробелов в поисковом запросе. Это обсуждается далее в разделе «Эскейпирование URL-адресов» этого документа.

Термин поискового запроса передается в службу WebSearch с использованием параметра q . Пример условия поискового запроса:

q=horses+cows+pigs

По умолчанию служба Google WebSearch возвращает только те документы, которые включают все термины поискового запроса.

Параметры запроса

В этом разделе перечислены параметры, которые вы можете использовать при создании поискового запроса. Параметры разделены на два списка. Первый список содержит параметры, релевантные всем поисковым запросам. Второй список содержит параметры, относящиеся только к запросам расширенного поиска.

Требуются три параметра запроса:

  • Параметр клиента должен иметь значение google-csbe
  • Выходной параметр определяет формат возвращаемых результатов XML; результаты могут быть возвращены с (xml) или без ( xml_no_dtd ) ссылки на Google DTD. Мы рекомендуем установить для этого значения xml_no_dtd . Примечание. Если вы не укажете этот параметр, результаты будут возвращены в формате HTML вместо XML.
  • Параметр cx , представляющий уникальный идентификатор механизма.

Наиболее часто используемые параметры запроса, кроме упомянутых выше:

  • num — запрошенное количество результатов поиска
  • q — поисковый запрос(ы)
  • start — начальный индекс результатов

Примеры запросов веб-поиска

В примерах ниже показано несколько HTTP-запросов WebSearch, чтобы проиллюстрировать, как используются различные параметры запроса. Определения различных параметров запроса представлены в разделах «Определения параметров запроса WebSearch» и «Параметры запроса расширенного поиска» этого документа.

Этот запрос запрашивает первые 10 результатов ( start=0&num=10 ) для термина запроса «red sox» ( q=red+sox ). Запрос также указывает, что результаты должны поступать с канадских веб-сайтов ( cr=countryCA ) и быть написаны на французском языке ( lr=lang_fr ). Наконец, в запросе указываются значения параметров client , output и cx , все три из которых являются обязательными.

http://www.google.com/search?
start=0
&num=10
&q=red+sox
&cr=countryCA
&lr=lang_fr
&client=google-csbe
&output=xml_no_dtd
&cx=00255077836266642015:u-scht7a-8i

В этом примере используются некоторые параметры расширенного поискового запроса для дальнейшей настройки поискового запроса. Этот запрос использует параметр as_q ( as_q=red+sox ) вместо параметра q . Он также использует параметр as_eq для исключения любых документов, содержащих слово «Янкиз», из результатов поиска ( as_eq=yankees ).

http://www.google.com/search?
start=0
&num=10
&as_q=red+sox
&as_eq=Yankees
&client=google-csbe
&output=xml_no_dtd
&cx=00255077836266642015:u-scht7a-8i

Определения параметров запроса WebSearch

c2coff
Описание

Необязательный . Параметр c2coff включает или отключает функцию поиска на упрощенном и традиционном китайском языке .

Значение по умолчанию для этого параметра — 0 (ноль), что означает, что функция включена. Значения параметра c2coff :

Ценить Действие
1 Неполноценный
0 Включено
Примеры q=google&c2coff=1

клиент
Описание

Необходимый . Параметр client должен иметь значение google-csbe .

Примеры q=google&client=google-csbe

кр
Описание

Необязательный . Параметр cr ограничивает результаты поиска документами, происходящими из определенной страны. Вы можете использовать логические операторы в значении параметра cr .

Google WebSearch определяет страну документа, анализируя:

  • домен верхнего уровня (TLD) URL-адреса документа
  • географическое расположение IP-адреса веб-сервера

Список допустимых значений для этого параметра см. в разделе «Значения параметра страны (cr) ».

Примеры q=Frodo&cr=countryNZ

сх
Описание

Необходимый . Параметр cx указывает уникальный код, идентифицирующий систему пользовательского поиска. Вы должны указать программируемую поисковую систему, используя параметр cx , чтобы получать результаты поиска из этой системы.

Чтобы узнать значение параметра cx , перейдите на вкладку «Панель управления» > «Коды» вашей системы, и вы найдете его в текстовой области в разделе «Вставьте этот код на страницу, где вы хотите, чтобы отображалось окно поиска». Результаты поиска будут показаны на странице, размещенной в Google».

Примеры q=Frodo&cx=00255077836266642015:u-scht7a-8i

фильтр
Описание

Необязательный . Параметр фильтра активирует или деактивирует автоматическую фильтрацию результатов поиска Google. Дополнительную информацию о фильтрах результатов поиска Google см. в разделе «Автоматическая фильтрация» этого документа.

Значение по умолчанию для параметра filter1 , что указывает на то, что функция включена. Допустимые значения для этого параметра:

Ценить Действие
1 Неполноценный
0 Включено

Примечание. По умолчанию Google применяет фильтрацию ко всем результатам поиска, чтобы улучшить их качество.

Примеры q=google&filter=0

гл
Описание

Необязательный . Значение параметра gl представляет собой двухбуквенный код страны. Для результатов веб-поиска параметр gl повышает результаты поиска, страна происхождения которых соответствует значению параметра. Список допустимых значений см. в разделе «Коды стран» .

Указание значения параметра gl в запросах WebSearch должно повысить релевантность результатов. Это особенно актуально для международных клиентов и, еще более конкретно, для клиентов в англоязычных странах, за исключением США.

Примеры

Этот запрос повышает рейтинг документов, написанных в Великобритании, в результатах веб-поиска:
q=pizza&gl=uk


гл
Описание

Необязательный . Параметр hl указывает язык интерфейса (язык хоста) вашего пользовательского интерфейса. Чтобы повысить производительность и качество результатов поиска, настоятельно рекомендуется указать этот параметр явно.

Дополнительные сведения см. в разделе «Языки интерфейса» документа «Интернационализация запросов и представления результатов», а список поддерживаемых языков — в разделе «Поддерживаемые языки интерфейса ».

Примеры

Этот запрос нацелен на рекламу вина на французском языке. ( Вин — французское слово, обозначающее вино.)

q=vin&ip=10.10.10.10&ad=w5& hl=fr

штаб-квартира
Описание

Необязательный . Параметр hq добавляет к запросу указанные условия запроса, как если бы они были объединены логическим оператором И.

Примеры

Этот запрос ищет слова «пицца» И «сыр». Выражение такое же, как q=pizza+cheese .

q=pizza&hq=cheese


т.е.
Описание

Необязательный . Параметр ie задает схему кодировки символов, которая должна использоваться для интерпретации строки запроса. ie по умолчанию является latin1 .

См. раздел «Кодировка символов» , где описано, когда вам может понадобиться использовать этот параметр.

Список возможных значений ie см. в разделе «Схемы кодирования символов» .

Примеры q=google&ie=utf8&oe=utf8
лр
Описание

Необязательный . Параметр lr (ограничение языка) ограничивает результаты поиска документами, написанными на определенном языке.

Google WebSearch определяет язык документа, анализируя:

  • домен верхнего уровня (TLD) URL-адреса документа
  • языковые метатеги в документе
  • основной язык, используемый в основном тексте документа
  • дополнительные языки, если таковые имеются, используемые в основном тексте документа

Список допустимых значений для этого параметра см. в разделе «Значения коллекции языка ( lr ) ».

Примеры q=Frodo&lr=lang_en

число
Описание

Необязательный . Параметр num определяет количество возвращаемых результатов поиска.

num значение по умолчанию — 10 , а максимальное значение — 20 . Если вы запросите более 20 результатов, будут возвращены только 20 результатов.

Примечание. Если общее количество результатов поиска меньше запрошенного, будут возвращены все доступные результаты поиска.

Примеры q=google& num=10

ой
Описание

Необязательный . Параметр oe задает схему кодировки символов, которая должна использоваться для декодирования результата XML. Значение oe по умолчанию — latin1 .

См. раздел «Кодировка символов» , где описано, когда вам может понадобиться использовать этот параметр.

Список возможных значений oe см. в разделе «Схемы кодирования символов» .

Примеры q=google&ie=utf8& oe=utf8

выход
Описание

Необходимый . output параметр определяет формат результатов XML. Единственные допустимые значения для этого параметра — xml и xml_no_dtd . В таблице ниже показано, чем отличаются значения этих параметров.

Ценить Выходной формат
xml_no_dtd Результаты XML не будут включать оператор !DOCTYPE. (Рекомендуемые)
xml Результаты XML будут содержать ссылку на Google DTD. Во второй строке результата будет указан тип определения документа (DTD), который используется в результатах:
    <!DOCTYPE GSP SYSTEM "google.dtd">
Примеры output=xml_no_dtd
output=xml

д
Описание

Необязательный . Параметр q указывает поисковый запрос, введенный пользователем. Несмотря на то, что этот параметр является необязательным, вы должны указать значение хотя бы для одного из параметров запроса ( as_epq , as_lq , as_oq , as_q , чтобы получить результаты поиска.

Существует также ряд специальных терминов запроса, которые можно использовать как часть значения параметра q . Список и определения этих терминов см. в разделе «Специальные условия запроса» .

Панель управления поиском Google включает отчет о самых популярных запросах, отправленных с использованием параметра q .

Примечание. Значение, указанное для параметра q , должно быть экранировано URL-адресом.

Примеры q=vacation &as_oq=london+paris

безопасный
Описание

Необязательный . Параметр safe указывает, как следует фильтровать результаты поиска для контента для взрослых и порнографического контента. Значение по умолчанию для safe параметра off . Допустимые значения параметров:

Ценить Действие
off Отключить безопасный поиск
medium Включить безопасный поиск
high Включить более строгую версию SafeSearch

Дополнительные сведения об этой функции см. в разделе «Фильтрация контента для взрослых с помощью безопасного поиска» .

Примеры q=adult&safe=high

начинать
Описание

Необязательный . Параметр start указывает первый совпадающий результат, который должен быть включен в результаты поиска. Параметр start использует индекс, отсчитываемый от нуля, что означает, что первый результат равен 0, второй результат — 1 и т. д.

Параметр start работает вместе с параметром num , чтобы определить, какие результаты поиска следует возвращать. Обратите внимание, что для любого запроса никогда не будет возвращено не более 1000 результатов, даже если запросу соответствует более 1000 документов, поэтому установка start значения 1000 или более не приведет к отсутствию результатов.

Примеры start=10

Сортировать
Описание

Необязательный . Параметр sort указывает, что результаты будут отсортированы в соответствии с указанным выражением. Например, отсортировать по дате.

Примеры

sort=date


уд
Описание

Необязательный . Параметр ud указывает, должен ли ответ XML включать URL-адрес в кодировке IDN для результата поиска. Кодировка IDN (международное доменное имя) позволяет отображать домены на местных языках, например:

http://www.花井鮨.com

Допустимые значения для этого параметра: 1 (по умолчанию), что означает, что результат XML должен включать URL-адреса в кодировке IDN, и 0 , что означает, что результат XML не должен включать URL-адреса в кодировке IDN. Если для параметра ud установлено значение 1 , URL-адрес в кодировке IDN будет отображаться в теге UD в результатах XML.

Если для параметра ud установлено значение 0 , URL-адрес в приведенном выше примере будет отображаться как:

http://www.xn--elq438j.com.

Примечание. Это бета-версия функции.

Примеры q=google&ud=1

Дополнительные параметры запроса, перечисленные под изображением, относятся к расширенным поисковым запросам. Когда вы отправляете расширенный поиск, значения нескольких параметров (например, as_eq , as_epq , as_oq и т. д.) учитываются в терминах запроса для этого поиска. На изображении показана страница расширенного поиска Google. На изображении имя каждого параметра расширенного поиска написано красным текстом внутри или рядом с полем на странице, которому соответствует этот параметр.



Параметры расширенного поискового запроса

as_dt
Описание

Необязательный . Параметр as_dt определяет, включать или исключать результаты с сайта, указанного в параметре as_sitesearch . Значения i и e обозначают включение и исключение соответственно.

Примеры as_dt=i,as_dt=e

as_epq
Описание

Необязательный . Параметр as_epq определяет фразу, которую должны содержать все документы в результатах поиска. Вы также можете использовать термин запроса для поиска фразы для поиска фразы.

Примеры as_epq=abraham+lincoln

as_eq
Описание

Необязательный . Параметр as_eq идентифицирует слово или фразу, которые не должны появляться ни в каких документах в результатах поиска. Вы также можете использовать условие запроса исключения , чтобы гарантировать, что определенное слово или фраза не появится в документах в наборе результатов поиска.

Примеры

q=bass&as_eq=music .


as_lq
Описание

Необязательный . Параметр as_lq указывает, что все результаты поиска должны содержать ссылку на определенный URL-адрес. Вы также можете использовать ссылку: термин запроса для этого типа запроса.

Примеры

as_lq=www.google.com


as_nlo
Описание

Необязательный . Параметр as_nlo указывает начальное значение диапазона поиска. Используйте as_nlo и as_nhi , чтобы добавить к запросу включающий диапазон поиска as_nlo...as_nhi .

Примеры

Следующее устанавливает диапазон поиска от 5 до 10 включительно:

as_nlo=5&as_nhi=10

as_nhi
Описание

Необязательный . Параметр as_nhi указывает конечное значение диапазона поиска. Используйте as_nlo и as_nhi , чтобы добавить к запросу включающий диапазон поиска as_nlo...as_nhi .

Примеры

Следующее устанавливает диапазон поиска от 5 до 10 включительно:

as_nlo=5&as_nhi=10

as_oq
Описание

Необязательный . Параметр as_oq предоставляет дополнительные условия поиска для проверки в документе, причем каждый документ в результатах поиска должен содержать хотя бы один из дополнительных условий поиска. Для этого типа запроса вы также можете использовать логическое ИЛИ .

Примеры

q=vacation&as_oq=London+Paris


as_q
Описание

Необязательный . Параметр as_q предоставляет условия поиска для проверки в документе. Этот параметр также часто используется, чтобы позволить пользователям указывать дополнительные термины для поиска в наборе результатов поиска.

Примеры

q=president&as_q=John+Adams


as_qdr
Описание

Необязательный . Параметр as_qdr запрашивает результаты поиска за указанный период времени (быстрый диапазон дат). Поддерживаются следующие значения:

d[number] запрашивает результаты за указанное количество прошлых дней.
w[number] запрашивает результаты за указанное количество прошлых недель.
m[number] запрашивает результаты за указанное количество прошлых месяцев.
y[number] запрашивает результаты за указанное количество прошлых лет.

Примеры

В этом примере запрашиваются результаты за прошлый год:

as_qdr=y

В этом примере запрашиваются результаты за последние 10 дней:

as_qdr=d10

as_sitesearch
Описание

Необязательный . Параметр as_sitesearch позволяет указать, что все результаты поиска должны быть страницами с данного сайта. Установив параметр as_dt , вы также можете использовать его для исключения страниц определенного сайта из результатов поиска.

Примеры

q=vacation&as_sitesearch=www.google.com


Специальные условия запроса

Google WebSearch позволяет использовать несколько специальных условий запроса, которые получают доступ к дополнительным возможностям поисковой системы Google. Эти специальные термины запроса должны быть включены в значение параметра запроса q . Как и другие термины запроса, специальные термины запроса должны быть экранированы URL-адресом . Некоторые специальные термины запроса содержат двоеточие (:). Этот символ также должен быть экранирован URL-адресом; его значение с экранированием URL-адреса — %3A .

Обратные ссылки [ссылка:]
Описание

link: термин запроса извлекает набор веб-страниц, которые ссылаются на определенный URL-адрес. Поисковый запрос должен быть отформатирован как link:URL без пробела между link: термин запроса и URL-адресом.

Версия link: с экранированием URL-адреса — link%3A .

Вы также можете использовать параметр запроса as_lq для отправки link: request.

Примечание. При использовании link: вы не можете указать какие-либо другие условия запроса.

Примеры

http://www.google.com/search? q=link%3Awww.example.com


Логическое ИЛИ Поиск [ ИЛИ ]
Описание

Термин запроса OR извлекает документы, которые включают один из нескольких (двух или более) терминов запроса. Чтобы использовать термин запроса OR , необходимо вставить поисковый термин OR заглавными буквами между каждым термином в серии.

Вы также можете использовать параметр запроса as_oq , чтобы отправить поиск по любому термину в наборе терминов.

Примечание. Если в поисковом запросе указан запрос «Лондон+ИЛИ+Париж», результаты поиска будут включать документы, содержащие хотя бы одно из этих двух слов. В некоторых случаях документы в результатах поиска могут содержать оба слова.

Примеры

Искать Лондон или Париж:

Пользовательский ввод: london OR paris Термин запроса: q=london+OR+paris

Поиск отпуска и Лондона или Парижа:

Термин запроса: q=vacation+london+OR+paris

Поиск отпуска и одного из Лондона, Парижа или шоколада:

Термин запроса: q=vacation+london+OR+paris+OR+chocolates

Найдите отпуск и шоколад, а также Лондон или Париж, при этом шоколаду будет придан наименьший вес:

Термин запроса: q=vacation+london+OR+paris+chocolates

Поиск отпуска, шоколада и цветов в документах, которые также содержат Лондон или Париж:

Термин запроса: q=vacation+london+OR+paris+chocolates+flowers

Найдите отпуск и один из Лондона или Парижа, а также найдите шоколад или цветы:

Термин запроса: q=vacation+london+OR+paris+chocolates+OR+flowers

Исключить термин запроса [-]
Описание

Условие запроса исключить ( - ) ограничивает результаты определенного поискового запроса документами, которые не содержат определенного слова или фразы. Чтобы использовать термин запроса на исключение, вы должны поставить перед словом или фразой, которую нужно исключить из соответствующих документов, знак «-» (знак минус).

Версия - с экранированием URL-адреса - %2D .

Исключить термин запроса полезен, когда термин поиска имеет более одного значения. Например, слово «бас» может возвращать результаты о рыбе или музыке. Если вы искали документы о рыбе, вы можете исключить документы о музыке из результатов поиска, используя условие запроса исключения.

Вы также можете использовать параметр запроса as_eq , чтобы исключить из результатов поиска документы, соответствующие определенному слову или фразе.

Примеры Пользовательский ввод: bass -music
Термин запроса: q=bass+ %2Dmusic

Исключение типа файла [ ​​-filetype: ]
Описание

Условие запроса -filetype: исключает из результатов поиска документы с определенным расширением файла, например «.pdf» или «.doc». Поисковый запрос должен быть отформатирован как -filetype:EXTENSION без пробела между термином запроса -filetype: и указанным расширением.

Версия -filetype: с экранированием URL-адреса: %2Dfiletype%3A .

Примечание. Вы можете исключить несколько типов файлов из результатов поиска, добавив в запрос дополнительные условия -filetype: В вашем поисковом запросе должен быть один термин -filetype: для каждого расширения файла, которое следует исключить из результатов поиска.

Типы файлов, поддерживаемые Google, включают:

  • Формат переносимого документа Adobe (pdf)
  • Adobe PostScript (пс)
  • Lotus 1-2-3 (1-я неделя, 2-я неделя, 3-я неделя, 4-я неделя, 5-я неделя, неделя, неделя, неделя)
  • Лотос WordPro (LWP)
  • Макрайт (МВт)
  • Microsoft Excel (xls)
  • Microsoft PowerPoint (п.п.)
  • Microsoft Word (документ)
  • Microsoft Works (wks, wps, wdb)
  • Microsoft Write (запись)
  • Расширенный текстовый формат (rtf)
  • Ударная волна (swf)
  • Текст (ans, txt).

В будущем могут быть добавлены дополнительные типы файлов. Актуальный список всегда можно найти в FAQ по типам файлов Google.

Примеры

В этом примере возвращаются документы, в которых упоминается «Google», но которые не являются документами PDF:
q=Google+ %2Dfiletype%3Apdf

В этом примере возвращаются документы, в которых упоминается «Google», но исключаются документы PDF и Word:
q=Google+ %2Dfiletype%3Apdf+%2Dfiletype%3Adoc


Фильтрация типов файлов [ тип файла: ]
Описание

Условие запроса filetype: ограничивает результаты поиска документами с определенным расширением файла, например «.pdf» или «.doc». Поисковый запрос должен быть отформатирован как тип файла: РАСШИРЕНИЕ без пробела между термином запроса filetype: и указанным расширением.

Версия filetype: с экранированием URL-адреса — это filetype%3A .

Вы можете ограничить результаты поиска документами, соответствующими одному из нескольких расширений файлов, добавив в запрос дополнительные filetype: термины запроса. У вас должен быть один filetype: термин запроса в поисковом запросе для каждого расширения файла, которое должно быть включено в результаты поиска. Несколько filetype: термины запроса должны быть разделены с помощью термина запроса OR .

По умолчанию результаты поиска будут включать документы с любым расширением файла.

Типы файлов, поддерживаемые Google, включают:

  • Формат переносимого документа Adobe (pdf)
  • Adobe PostScript (пс)
  • Lotus 1-2-3 (1-я неделя, 2-я неделя, 3-я неделя, 4-я неделя, 5-я неделя, неделя, неделя, неделя)
  • Лотос WordPro (LWP)
  • Макрайт (МВт)
  • Microsoft Excel (xls)
  • Microsoft PowerPoint (п.п.)
  • Microsoft Word (документ)
  • Microsoft Works (wks, wps, wdb)
  • Microsoft Write (запись)
  • Расширенный текстовый формат (rtf)
  • Ударная волна (swf)
  • Текст (ans, txt).

В будущем могут быть добавлены дополнительные типы файлов. Актуальный список всегда можно найти в FAQ по типам файлов Google.

Примеры

В этом примере возвращаются PDF-документы, в которых упоминается «Google»:
q=Google+ filetype%3Apdf

В этом примере возвращаются документы PDF и Word, в которых упоминается «Google»:
q=Google+ filetype%3Apdf+OR+filetype%3Adoc


Включить термин запроса [+]
Описание

Термин запроса включения (+) указывает, что слово или фраза должны встречаться во всех документах, включенных в результаты поиска. Чтобы использовать термин запроса включения, вы должны поставить перед словом или фразой, которая должна быть включена во все результаты поиска, знак «+» (знак плюса).

Версия + (знак плюс) с экранированием URL-адреса — %2B .

Вам следует использовать + перед общим словом, которое Google обычно отбрасывает при определении результатов поиска.

Примеры Пользовательский ввод: Star Wars Episode +I
Термин запроса: q=Star+Wars+Episode+ %2BI

Только поиск по ссылкам, все термины [ allinlinks: ]
Описание

Условия запроса allinlinks: требуют, чтобы документы в результатах поиска содержали все слова поискового запроса в URL-ссылках. Поисковый запрос должен быть отформатирован как allinlinks: за ним следуют слова из вашего поискового запроса.

Если ваш поисковый запрос включает запрос allinlinks: Google будет проверять только URL-ссылки в документах на наличие слов в вашем поисковом запросе, игнорируя другой текст в документах, заголовки документов и URL-адреса каждого документа. Обратите внимание, что URL-адрес документа отличается от URL-ссылок, содержащихся в документе.

Версия allinlinks: с экранированием URL-адреса: allinlinks%3A .

Примеры Пользовательский ввод: allinlinks: Google search
Термин запроса: q= allinlinks%3A+Google+search

Поиск фраз
Описание

Термин запроса фразового поиска ("") позволяет искать полные фразы, заключая фразы в кавычки или соединяя их дефисами.

Версия " (кавычка) с экранированием URL-адреса — %22 .

Поиск по фразам особенно полезен, если вы ищете известные цитаты или имена собственные.

Вы также можете использовать параметр запроса as_epq для отправки поиска по фразе.

Примеры Пользовательский ввод: "Abraham Lincoln"
Термин запроса: q= %22Abraham+Lincoln%22

Только текстовый поиск, все термины [allintext:]
Описание

Термин запроса allintext: требует, чтобы каждый документ в результатах поиска содержал все слова поискового запроса в теле документа. Запрос должен быть отформатирован как allintext: за ним следуют слова из вашего поискового запроса.

Если ваш поисковый запрос включает термин allintext: Google будет проверять только основной текст документов на наличие слов в вашем поисковом запросе, игнорируя ссылки в этих документах, названия документов и URL-адреса документов.

Версия allintext: с экранированием URL-адреса — allintext%3A .

Примеры В этом примере указано, что слова «Google» и «поиск» должны присутствовать в тексте всех документов, включенных в результаты поиска:
Пользовательский ввод: allintext:Google search
Термин запроса: q=allintext%3AGoogle+search

Поиск по названию, один термин [intitle:]
Описание

Термин запроса intitle: ограничивает результаты поиска документами, которые содержат определенное слово в заголовке документа. Поисковый запрос должен быть отформатирован как intitle:WORD без пробела между термином запроса intitle: и следующим словом.

Примечание. Вы можете указать более одного слова, которое должно быть включено в заголовок документа, поместив термин intitle: запрос перед каждым таким словом. Вы также можете использовать термин запроса allintitle:, чтобы указать, что все слова запроса должны быть включены в заголовки документов, которые находятся в результатах поиска.

Версия intitle: с экранированием URL-адреса — intitle%3A .

Примеры

В этом примере указывается, что слово «Google» должно появляться в заголовках любых документов в результатах поиска, а слово «поиск» должно появляться в любом месте заголовков, URL-адресов, ссылок или основного текста этих документов:
Пользовательский ввод: intitle:Google search
Термин запроса: q= intitle%3AGoogle+search


Поиск по названию, все термины [allintitle:]
Описание

Термин запроса allintitle: ограничивает результаты поиска документами, которые содержат все слова запроса в заголовке документа. Чтобы использовать термин запроса allintitle: включите «allintitle:» в начало поискового запроса.

Примечание. Размещение allintitle: в начале поискового запроса эквивалентно помещению intitle: перед каждым словом в поисковом запросе.

Версия allintitle: с экранированием URL-адреса — allintitle%3A .

Примеры

В этом примере указано, что слова «Google» и «поиск» должны появляться в заголовках любых документов в результатах поиска:
Пользовательский ввод: allintitle: Google search
Термин запроса: q= allintitle%3A+Google+search


URL-поиск, один термин [inurl:]
Описание

Термин запроса inurl: ограничивает результаты поиска документами, которые содержат определенное слово в URL-адресе документа. Поисковый запрос должен быть отформатирован как inurl:WORD без пробела между термином запроса inurl: и следующим словом.

Термин запроса inurl: игнорирует пунктуацию и использует только первое слово, следующее за оператором inurl: Вы можете указать более одного слова, которое должно быть включено в URL-адрес документа, поместив термин запроса inurl: перед каждым таким словом. Вы также можете использовать термин запроса allinurl:, чтобы указать, что все слова запроса должны быть включены в URL-адреса документов, которые находятся в результатах поиска.

Версия inurl: с экранированием URL-адреса — inurl%3A .

Примеры

В этом примере указывается, что слово «Google» должно появляться в URL-адресах любых документов в результатах поиска, а слово «поиск» должно появляться в любом месте заголовков, URL-адресов, ссылок или основного текста этих документов:
Пользовательский ввод: inurl:Google search
Термин запроса: q= inurl%3AGoogle+search


URL-поиск, все термины [allinurl:]
Описание

Термин запроса allinurl: ограничивает результаты поиска документами, которые содержат все слова запроса в URL-адресе документа. Чтобы использовать термин запроса allinurl: включите allinurl: в начало поискового запроса.

Термин запроса allinurl: игнорирует пунктуацию, поэтому он работает только со словами, а не с компонентами URL. Например, allinurl: uk/scotland ограничит результаты документами, которые содержат слова «uk» и «scottland» в своих URL-адресах, но не потребует, чтобы эти два слова появлялись в каком-либо определенном порядке или чтобы они были разделены косой чертой.

Версия allinurl: с экранированием URL-адреса — allinurl%3A .

Примеры

В этом примере указано, что слова «Google» и «поиск» должны присутствовать в URL-адресах любых документов в результатах поиска:
Пользовательский ввод: allinurl: Google search
Термин запроса: q= allinurl%3A+Google+search



Информация о веб-документе [информация:]
Описание

Термин запроса info: извлекает общую информацию об URL-адресе, если этот URL-адрес включен в поисковый индекс Google. Поисковый запрос должен быть отформатирован как info:URL без пробела между термином запроса info: и URL-адресом.

Версия info: с экранированием URL-адреса — это info%3A .

Примечание. При использовании info: вы не можете указать какие-либо другие условия запроса.

Примеры Пользовательский ввод: info:www.google.com
Условия запроса: q= info%3Awww.google.com

Примеры запросов изображений

В примерах ниже показано несколько HTTP-запросов изображений, чтобы проиллюстрировать, как используются различные параметры запроса. Определения различных параметров запроса представлены в разделах «Определения параметров запроса изображения» этого документа.

Этот запрос запрашивает первые 5 результатов ( start=0&num=5 ) для термина запроса «обезьяна» ( q=monkey ) с типом файла .png. Наконец, в запросе указываются значения параметров client , output и cx , все три из которых являются обязательными.

http://www.google.com/cse?
  searchtype=image
  start=0
  &num=5
  &q=monkey
  &as_filetype=png
  &client=google-csbe
  &output=xml_no_dtd
  &cx=00255077836266642015:u-scht7a-8i

Параметры запроса поиска изображений

as_filetype
Описание

Необязательный . Возвращает изображения указанного типа. Допустимые значения: bmp , gif , png , jpg и svg .

Примеры q=google&as_filetype=png

imgsz
Описание

Необязательный . Возвращает изображения указанного размера, где размер может быть одним из:

  • icon (маленький)
  • small|medium|large|xlarge (средний)
  • xxlarge (большой)
  • huge (очень большой)

Примеры q=google&as_filetype=png&imgsz=icon

тип изображения
Описание

Необязательный . Возвращает изображения типа, который может быть одним из:

  • clipart (клипарт)
  • face (лицо)
  • lineart (линейный)
  • news (новости)
  • photo (фото)

Примеры q=google&as_filetype=png&imgtype=photo

imgc
Описание

Необязательный . Возвращает черно-белые, полутоновые или цветные изображения:

  • mono (черно-белый)
  • gray (оттенки серого)
  • color (цвет)

Примеры q=google&as_filetype=png&imgc=gray

imgcolor
Описание

Необязательный . Возвращает изображения определенного доминирующего цвета:

  • yellow
  • green
  • teal
  • blue
  • purple
  • pink
  • white
  • gray
  • black
  • brown
Примеры q=google&as_filetype=png&imgcolor=yellow

as_rights
Описание

Необязательный . Фильтры на основе лицензирования. Поддерживаемые значения включают в себя:

  • cc_publicdomain
  • cc_attribute
  • cc_sharealike
  • cc_noncommercial
  • cc_nonderived

Примеры q=cats&as_filetype=png&as_rights=cc_attribute

Ограничения запросов

В таблице ниже перечислены ограничения на поисковые запросы, которые вы отправляете в Google:

Компонент Лимит Комментарий
Длина поискового запроса 2048 байт
Количество условий запроса 10 включает термины в следующих параметрах: q , as_epq , as_eq , as_lq , as_oq , as_q.
Количество результатов 20 Если вы установите для параметра num число больше 20, будет возвращено только 20 результатов. Чтобы получить больше результатов, вам нужно будет отправить несколько запросов и увеличивать значение параметра start с каждым запросом.

Интернационализация запросов и представление результатов

Служба Google WebSearch позволяет искать документы на нескольких языках. Вы можете указать кодировку символов, которая должна использоваться для интерпретации вашего HTTP-запроса и кодирования вашего XML-ответа (используя параметры поиска ie и oe ). Вы также можете отфильтровать результаты, чтобы включать только документы, написанные на определенных языках.

В следующих разделах обсуждаются вопросы, связанные с поиском на нескольких языках:

Кодировка символов

Серверы отправляют данные, например веб-страницы, пользовательским агентам, например браузерам, в виде последовательности закодированных байтов. Затем пользовательский агент декодирует байты в последовательность символов. При отправке запросов к службе WebSearch вы можете указать схемы кодирования как для вашего поискового запроса, так и для получаемого ответа XML.

Вы можете использовать параметр запроса ie , чтобы указать механизм кодирования символов в вашем HTTP-запросе. Вы также можете использовать параметр oe , чтобы указать схему кодирования, которую Google должен использовать для кодирования вашего ответа XML. Если вы используете схему кодирования, отличную от ISO-8859-1 (или latin1 ), убедитесь, что вы указали правильные значения для параметров ie и oe .

Примечание. Если вы предоставляете функцию поиска для нескольких языков, мы рекомендуем использовать значение кодировки utf8 (UTF-8) как для параметров ie , так и для oe .

Полный список значений, которые можно использовать для параметров ie и oe , см. в приложении «Схемы кодировки символов» .

Более общую информацию о кодировке символов см. на странице http://www.w3.org/TR/REC-html40/charset.html .

Языки интерфейса

Вы можете использовать параметр запроса hl , чтобы определить язык вашего графического интерфейса. Значение параметра HL может повлиять на результаты поиска XML, особенно на международные запросы, когда языковое ограничение (с использованием параметра LR ) явно не указано. В таких случаях параметр HL может способствовать результатам поиска на том же языке, что и язык ввода пользователя.

Мы предлагаем вам явно установить параметр HL в результатах поиска, чтобы убедиться, что Google выбирает результаты поиска высочайшего качества для каждого запроса.

Пожалуйста, смотрите раздел «Поддерживаемые языки интерфейса» для полного списка допустимых значений для параметра HL .

Поиск документов, написанных на определенных языках

Вы можете использовать параметр запроса LR , чтобы ограничить результаты поиска документами, которые написаны на конкретном языке или наборе языков.

Параметр LR поддерживает логические операторы , чтобы позволить вам указать несколько языков, которые должны быть включены (или исключены) из результатов поиска.

Следующие примеры показывают, как вы можете использовать логические операторы для запроса документов на разных языках.

Для документов, написанных на японском:

lr=lang_jp

Для документов, написанных на итальянском или немецком языке:

lr=lang_it|lang_de

Для документов, не написанных в венгерском или чешском:

lr=(-lang_hu).(-lang_cs)

Пожалуйста, смотрите раздел значений языковых сбора для полного списка возможных значений для параметра LR и раздела Boolean Operators для полного обсуждения использования этих операторов.

Упрощенные китайские и традиционные китайцы являются двумя вариантами письма китайского языка. Та же концепция может быть написана по -разному в каждом варианте. Учитывая запрос в одном из вариантов, служба веб -исследования Google может возвращать результаты, которые включают страницы в обоих вариантах.

Чтобы использовать эту функцию:

  1. Установите параметр запроса C2COFF на 0
    и
  2. Выполните одно из следующих действий:
    • Не устанавливайте параметр запроса LR
      или
    • Установите параметр запроса LR на lr = lang_zh-tw | lang_zh-cn

В следующем примере показаны параметры запроса, которые вы включите в запрос о результатах как в упрощенном, так и в традиционном китайском языке. (Обратите внимание, что дополнительная необходимая информация, такая как клиент , не включена в пример.)

search?hl=zh-CN
    &lr=lang_zh-TW|lang_zh-CN
    &c2coff=0

Фильтрация результатов

Google Websearch предоставляет ряд способов фильтрации результатов вашего поиска:

Автоматическая фильтрация результатов поиска

Чтобы обеспечить наилучшие результаты поиска, Google использует два метода для автоматического фильтрации результатов поиска, которые обычно считаются нежелательными:

  • Дубликации контента - если несколько документов содержат одну и ту же информацию, то только наиболее соответствующий документ этого набора включен в результаты вашего поиска.

  • Стопки хоста - если есть много результатов поиска с того же сайта, Google может не показать все результаты этого сайта или могут показать результаты ниже в
    Рейтинг, чем они были бы в противном случае.

Мы рекомендуем оставить эти фильтры для типичных запросов на поиск, потому что фильтры значительно повышают качество большинства результатов поиска. Тем не менее, вы можете обойти эти автоматические фильтры, установив параметр Filter Query на 0 в вашем запросе поиска.

Фильтрация языка и страны

Служба Google Websearch возвращает результаты из главного индекса всех веб -документов. Мастер -индекс содержит подколлекции документов, которые сгруппированы по конкретным атрибутам, включая язык и страну происхождения.

Вы можете использовать параметры запроса LR и CR , чтобы ограничить результаты поиска в подколлекциях документов, которые написаны на конкретных языках или происходят из конкретных стран, соответственно.

Google Websearch определяет язык документа, анализируя:

  • Домен верхнего уровня (TLD) URL-адреса документа
  • Языковые метатеги в документе
  • Основной язык, используемый в тексте тела документа


Пожалуйста, также см. Определение параметра LR , раздел о поиске документов, написанных на определенных языках, и значения сбора языка , которые можно использовать в качестве значений для параметра LR для получения дополнительной информации об ограничении результатов на основе языка.

Google Websearch определяет страну документа, анализируя:

  • Домен верхнего уровня (TLD) URL-адреса документа
  • Географическое местоположение IP -адреса веб -сервера

Пожалуйста, также смотрите определение параметра CR и значения сбора страны , которые можно использовать в качестве значений для параметра CR для получения дополнительной информации об ограничении результатов по стране происхождения.

Примечание. Вы можете объединить языковые ценности и ценности страны, чтобы настроить результаты поиска. Например, вы можете запросить документы, написанные на французском языке и приехать из Франции или Канады, или вы можете запросить документы, которые поступают из Голландии и не написаны на английском языке. Параметры LR и CR поддерживают логические операторы .

Фильтрация контента для взрослых с помощью Safesearch

Многие клиенты Google не хотят отображать результаты поиска для сайтов, которые содержат контент для взрослых. Используя наш фильтр SafeSearch, вы можете проверить результаты поиска, которые содержат содержание взрослых, и устранить их. Фильтры Google используют собственную технологию для проверки ключевых слов, фраз и URL -адресов. Несмотря на то, что фильтры на 100 процентов точны, Safesearch удалит подавляющее большинство контента для взрослых из результатов поиска.

Google стремится сохранить Safesearch настолько актуальным и всеобъемлющим, насколько это возможно, постоянно ползая в Интернете и включив обновления из предложений пользователей.

SafeSearch доступен на следующих языках:

Голландский
Английский
Французский
Немецкий
итальянский
Португальский (бразильский)
испанский
Традиционный китайский

Вы можете скорректировать степень, в которой Google фильтрует ваши результаты для содержания взрослых, используя параметр безопасного запроса. В следующей таблице объясняется настройки Safesearch Google и то, как эти настройки будут влиять на результаты вашего поиска:

Уровень SafeSearch Описание
высокий Включает более строгую версию безопасного поиска.
середина Блокирует веб -страницы, содержащие порнографию и другое явное сексуальное содержание.
выключенный Не фильтрует содержание взрослых из результатов поиска.

* Настройка Safesearch по умолчанию выключена .

Если у вас активирован SafeSearch и вы найдете сайты, которые содержат оскорбительный контент в ваших результатах, пожалуйста, напишите URL -адрес сайта по адресу safesearch@google.com , и мы расследуем сайт.

Результаты XML

Google XML -результаты DTD

Google использует один и тот же DTD для описания формата XML для всех типов результатов поиска. Многие из тегов и атрибутов применимы для всех типов поиска. Некоторые теги, однако, применимы только для определенных типов поиска. Следовательно, определения в DTD могут быть менее ограничительными, чем определения, приведенные в этом документе.

В этом документе описываются те аспекты DTD, которые имеют отношение к веб -исследованиям. Когда вы смотрите на DTD, если вы работаете над веб -исследователь, вы можете безопасно игнорировать теги и атрибуты, которые здесь не задокументированы. Если определение отличается между DTD и документацией, этот факт отмечается в этом документе.

Google может вернуть результаты XML с или без ссылки на самый последний DTD. DTD - это руководство, которое поможет поисковым администраторам и анализаторам XML понять результаты XML Google. Поскольку грамматика XML от Google может время от времени меняться, вы не должны настраивать свой анализатор для использования DTD для проверки каждого результата XML.

Кроме того, вы не должны настраивать свой анализатор XML, чтобы приносить DTD каждый раз, когда вы отправляете запрос на поиск. Google обновляет DTD нечасто, и эти запросы создают ненужные требования задержки и пропускной способности.

Google рекомендует использовать выходной формат xml_no_dtd , чтобы получить результаты XML. Если вы указали формат вывода XML в своем запросе поиска, единственная отличие - включение следующей строки в результаты XML:

<!DOCTYPE GSP SYSTEM "google.dtd">

Вы можете получить доступ к последнему DTD по адресу http://www.google.com/google.dtd .

Обратите внимание, что не все функции в DTD могут быть доступны или поддерживаются в настоящее время.

О ответе XML

  • Все значения элементов действительны HTML, подходящие для отображения, если не указано иное в определениях тегов XML.
  • Некоторые значения элементов-это URL-адреса, которые должны быть кодированы HTML, прежде чем они будут отображаться.
  • Ваш анализатор XML должен игнорировать недокументированные атрибуты и теги. Это позволяет вашему приложению продолжать работать без модификации, если Google добавляет больше функций к выводу XML.
  • Определенные символы должны быть сбежаны при включении в качестве значений в теги XML. Ваш процессор XML должен преобразовать эти сущности обратно в соответствующие символы. Если вы не преобразуете объекты должным образом, браузер может, например, сделать и характер как «& amp;». Стандартный XML документирует эти символы; Эти символы воспроизведены в таблице ниже:

    Характер Сбежали формы Сущность Код символа
    Ampersand & & amp; &#38;
    Единственная цитата ' & apos; &#39;
    Двойная цитата " & quot; &#34;
    Больше чем > & gt; &#62;
    Меньше, чем < & lt; &#60;

Результаты XML для регулярных и расширенных поисковых запросов

Регулярный/расширенный поиск: примеры запроса и XML -результат

В этом примере запроса на веб -исследователь требуется 10 результатов ( num=10 ) о поисковом термине «Socer» ( q=socer ), которое является словом «футбол», намеренно написано неправильно для этого примера.)

http://www.google.com/search?
q=socer
&hl=en
&start=10
&num=10
&output=xml
&client=google-csbe
&cx=00255077836266642015:u-scht7a-8i

Этот запрос дает результат XML ниже. Обратите внимание, что в результате XML есть несколько комментариев, чтобы указать, где появятся определенные теги, не включенные в результат.

<?xml version="1.0" encoding="ISO-8859-1" standalone="no" ?>

<GSP VER="3.2">
<TM>0.452923</TM>
<Q>socer</Q>
<PARAM name="cx" value="00255077836266642015:u-scht7a-8i" original_value="00255077836266642015%3Au-scht7a-8i"/>
<PARAM name="hl" value="en" original_value="en"/>
<PARAM name="q" value="socer" original_value="socer"/>
<PARAM name="output" value="xml" original_value="xml"/>
<PARAM name="client" value="google-csbe" original_value="google-csbe"/>
<PARAM name="num" value="10" original_value="10"/>
<Spelling>
<Suggestion q="soccer"><b><i>soccer</i></b></Suggestion>
</Spelling>
<Context>
<title>Sample Vacation CSE</title>
<Facet>
<FacetItem>
<label>restaurants</label>
<anchor_text>restaurants</anchor_text>
</FacetItem>
<FacetItem>
<label>wineries</label>
<anchor_text>wineries</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>golf_courses</label>
<anchor_text>golf courses</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>hotels</label>
<anchor_text>hotels</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>nightlife</label>
<anchor_text>nightlife</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>soccer_sites</label>
<anchor_text>soccer sites</anchor_text>
</FacetItem>
</Facet>
</Context>
<RES SN="1" EN="10">
<M>6080</M>
/*
* The FI tag after the comment indicates that the result
* set has been filtered. If the number of results were exact, the
* FI tag would be replaced by an XT tag in the same format.
*/
<FI />
<NB>
/*
* Since the request is for the first page of results, the PU tag,
* which contains a link to the previous page of search results,
* is not included in this XML result. If the sample result did include
* a previous page of results, it would be listed here, in the same format
* as the NU tag on the following line
*/
<NU>/search?q=socer&hl=en&lr=&ie=UTF-8&output=xml&client=test&start=10&sa=N</NU>
</NB>
<R N="1">
<U>http://www.soccerconnection.net/</U>
<UE>http://www.soccerconnection.net/</UE>
<T>SoccerConnection.net</T>
<CRAWLDATE>May 21, 2007</CRAWLDATE>
<S><b>soccer</b>; players; coaches; ball; world cup;<b>...</b></S>
<Label>transcodable_pages</Label>
<Label>accessible</Label>
<Label>soccer_sites</Label>
<LANG>en</LANG>
<HAS>
<DI>
<DT>SoccerConnection.net</DT>
<DS>Post your <b>soccer</b> resume directly on the Internet.</DS>
</DI>
<L/>
<C SZ="8k" CID="kWAPoYw1xIUJ"/>
<RT/>
</HAS>
</R>
/*
* The result includes nine more results, each enclosed by an R tag.
*/
</RES>
</GSP>

Обычный/расширенный поиск: теги XML

Ответы XML для регулярных запросов поиска и расширенных запросов поиска используют один и тот же набор тегов XML. Эти теги XML показаны в примере XML выше и объяснены в таблицах ниже.

Теги XML ниже перечислены в алфавитном порядке по имени тега, и каждое определение тега содержит описание тега, пример, показывающий, как тег будет отображаться в результате XML, и в формате содержания тега. Если тег представляет собой подтаг другой теги XML или если тег имеет собственные подтэги или собственные атрибуты, эта информация также предоставляется в таблице определения тега.

Некоторые символы могут отображаться рядом с некоторыми подтуями в приведенных ниже определениях. Эти символы и их значения:

? = необязательный подтхт
* = ноль или более экземпляров субтага
+ = один или несколько случаев субтага
А Б С Д Ф г ЧАС я л М Н п вопрос р С Т ты Икс

Anchor_Text
Определение

Тег <Anchor_text> указывает текст, который вы должны отобразить пользователям, чтобы идентифицировать этикетку уточнения , связанную с набором результатов поиска. Поскольку этикетки уточнения заменяют неалфаномерные символы на подчеркивание, вы не должны отображать значение тега <babel> в вашем пользовательском интерфейсе. Вместо этого вы должны отобразить значение тега <Anchor_text> .

Пример <Anchor_text> Поля для гольфа </archor_text>
Подтаг FaceTiTem
Формат контента Текст

БЛОКИРОВАТЬ
Определение

Этот тег инкапсулирует содержимое блока в линии тела результата продвижения. Каждый блок имеет подтэг T , U и L. Непустые t тег обозначает, что блок содержит текст; Непустые теги U и L обозначают, что блок содержит ссылку (с URL -адресом, приведенным в UBTAG U -Subtag и привязке в подтаге L ).

Субтаги T , U , L
Подтаг Body_line
Формат контента Пустой

Body_line
Определение

Этот тег инкапсулирует содержимое линии в телеоценленном результате. Каждая линия тела состоит из нескольких блок -тегов, которые либо содержат какой -то текст, либо ссылку с URL -адресом и якорным текстом.

Субтаги БЛОКИРОВАТЬ *
Подтаг Sl_main
Формат контента Пустой

С
Определение

Тег <c> указывает, что служба веб -исследования может получить кэшированную версию этого URL -адреса результатов поиска. Вы не можете получить кэшированные страницы через XML API, но вы можете перенаправить пользователей на www.google.com для этого контента.

Атрибуты
Имя Формат Описание
СЗ Текст (целое число + "k") Предоставляет размер кэшированной версии результата поиска в килобитах («K»).
Сид Текст Определяет документ в кэше Google. Чтобы получить документ из кэша, отправьте поисковый термин, созданный следующим образом:
Кэш: Cidtext : Essapedurl

Убежденный URL -адрес доступен в теге UE .

Пример <C sz = "6k" cid = "kvoxk_cyssgj" />
Подтаг ИМЕЕТ
Формат контента Пустой

C2C
Определение Тег <c2c> указывает на то, что результат относится к традиционной странице китайского языка. Этот тег появляется только при упрощенном и традиционном поиске в китайском поиске . См. Определение параметра запроса C2COFF для получения дополнительной информации о включении и отключении этой функции.
Формат контента Текст

Контекст
Определение

Тег <context> инкапсулирует список меток уточнения, связанных с набором результатов поиска.

Пример <Контекст>
Субтаги Название , аспект +
Формат контента Контейнер

Crawldate
Определение

Тег <Crawldate> определяет дату, когда страница была последней полза. CRAWLDATE не возвращается для каждой страницы результатов поиска.

Пример <Crawladate> 21 мая 2005 г. </crawldate>
Подтаг р
Формат контента Текст

ДИ
Определение

Тег <di> инкапсулирует информацию о категории Project Directory (ODP) для одного результата поиска.

Пример <Di>
Субтаги DT ?, DS ?
Подтаг ИМЕЕТ
Формат контента Пустой

ДС
Определение

Тег <ds> предоставляет резюме, указанную для одной категории в каталоге ODP.

Пример <ds> опубликовать свой & lt; b & gt; Soccer & lt;/b & gt; возобновить прямо в Интернете. </ds>
Подтаг ДИ
Формат контента Текст (может содержать HTML)

ДТ
Определение

Тег <dt> предоставляет заголовок для одной категории, указанной в каталоге ODP.

Пример <dt> soccerconnection.net </dt>
Подтаг ДИ
Формат контента Текст (может содержать HTML)

Аспект
Определение

Тег <Facet> содержит логическую группировку тегов <FaceTiTem> . Вы можете создать эти группировки, используя формат спецификации программируемой поисковой машины XML . Если вы не создаете эти группировки, тег Results_xml_tag_context> <context> тег будет содержать до четырех тегов <Facet> . Элементы в каждом теге <Facet> будут сгруппированы для целей отображения, но могут не иметь логических отношений.

Пример <Фазек>
Субтаги FaceTiTem +, название +
Подтаг Контекст
Формат контента Контейнер

FaceTiTem
Определение

Тег <AcetiTem> инкапсулирует информацию о этикетке уточнения, связанной с набором результатов поиска.

Пример <Facetitem>
Субтаги метка , Anchor_Text +
Подтаг Аспект
Формат контента FaceTiTem

ФИ
Определение Тег <fi> служит флагом, который указывает, была ли выполнена фильтрация документов для поиска. См. Раздел автоматической фильтрации этого документа для получения дополнительной информации о фильтрах результатов поиска Google.
Пример <Fi />
Подтаг ВИЭ
Формат контента Пустой

ВСП
Определение

Тег <gsp> инкапсулирует все данные, возвращаемые в результатах поиска Google XML. «GSP» - это аббревиатура для «протокола поиска Google».

Атрибуты
Имя Формат Описание
ВЕР Текст (целое число) Атрибут VER определяет версию выхода результатов поиска. Текущая версия вывода «3.2».
Пример <Gsp ver = "3,2">
Субтаги Param +, Q , res ?, TM
Формат контента Пустой

ИМЕЕТ
Определение Тег <shes> инкапсулирует информацию о любых специальных параметрах запроса поиска , поддерживаемых для конкретного URL.

ПРИМЕЧАНИЕ. Определение <Shast> для веб -исследователь более ограничено, чем в DTD .

Субтаги Di ?, L ?, C ?, Rt ?
Подтаг р

Isurl
Определение Google возвращает тег <surl> , если связанный поисковый запрос является URL.
Подтаг ВСП
Формат контента Пустой

л
Определение Наличие тега <l> указывает на то, что служба веб -исследования может найти другие сайты, которые ссылаются на этот URL -адрес результата поиска. Чтобы найти такие сайты, вы будете использовать ссылку: Специальный термин запроса.
Подтаг ИМЕЕТ
Формат контента Пустой

этикетка
Определение

Тег <babel> определяет этикетку уточнения, которую вы можете использовать для фильтрации полученных результатов поиска. Чтобы использовать этикетку уточнения, добавьте строку больше: [[значение тега метки]] к значению параметра Q в вашем HTTP -запросе в Google, как показано в следующем примере. Обратите внимание, что это значение должно быть связано с URL, прежде чем отправлять запрос в Google.

This example uses the refinement label golf_courses to
filter search results about Palm Springs:
q=Palm+Springs+more:golf_courses

The URL-escaped version of this query is:
q=Palm+Springs+more%3Agolf_courses

ПРИМЕЧАНИЕ. Тег <babel> не совпадает с тегом <babel> , которая идентифицирует этикетку изысканности, связанную с конкретным URL -адресом в результатах вашего поиска.

Пример <babel> Golf_courses </label>
Подтаг FaceTiTem
Формат контента Текст

ЯЗЫК
Определение

Тег <lang> содержит лучшее предположение Google о языке результатов поиска.

Пример <lang> en </lang>
Подтаг р
Формат контента Текст

М
Определение

Тег <m> идентифицирует предполагаемое общее количество результатов для поиска.

Примечание: эта оценка может быть не точной.

Пример <m> 16200000 </m>
Подтаг ВИЭ
Формат контента Текст

Примечание:
Определение

Тег <nb> инкапсулирует навигационную информацию - подключится к следующей странице результатов поиска или на предыдущей странице результатов поиска - для набора результатов.

Примечание. Этот тег присутствует только в том случае, если доступно больше результатов.

Пример <nb>
Субтаги Nu ?, PU ?
Подтаг ВИЭ
Формат контента Пустой

НУ
Определение

Тег <nu> содержит относительную ссылку на следующую страницу результатов поиска.

Пример <Nu>/search? Q = цветы и num = 10 & hl = en & ie = utf-8
& output = xml & client = test & start = 10 </nu>
Подтаг Примечание:
Формат контента Текст (относительный URL)

ПАРАМ
Определение

Тег <param> идентифицирует входной параметр, представленный в HTTP -запросе, связанный с результатом XML. Информация о параметре содержится в атрибутах тега - имен, значение, исходная_Вала - и будет один тег параметров для каждого параметра, представленного в HTTP -запросе.

Атрибуты
Имя Формат Описание
имя Текст Имя параметра ввода.
ценить HTML HTML-форматированная версия значения входного параметра.
Original_value Текст Оригинальная версия значения параметра ввода .
Пример <Param name = "cr" value = "countrynz" original_value = "countrynz" />
Подтаг ВСП
Формат контента Сложный

ПУ
Определение

Тег <pe> предоставляет относительную ссылку на предыдущую страницу результатов поиска.

Пример <Pu>/search? Q = цветы и num = 10 & hl = en & output = xml
& client = test & start = 10 </pu>
Подтаг Примечание:
Формат контента Текст (относительный URL)

вопрос
Определение

Тег <q> идентифицирует поисковый запрос, представленный в HTTP -запросе, связанный с результатом XML.

Пример

<q> пицца </q>

Подтаг ВСП
Формат контента Текст

р
Определение

Тег <r> инкапсулирует детали отдельного результата поиска.

ПРИМЕЧАНИЕ. Определение тега <r> для веб -исследования более ограничительно, чем в DTD .

Атрибуты
Имя Формат Описание
Н Текст (целое число) Указывает индекс (1 на основе) этого результата поиска.
Мима Текст Указывает тип MIME результата поиска.
Субтаги Ты , ты , т ?, Кроудат , с ?, Ланг ?
Подтаг ВИЭ

ВИЭ
Определение

Тег <S -RE> инкапсулирует набор отдельных результатов поиска и подробностей об этих результатах.

Атрибуты
Имя Формат Описание
СН Текст (целое число) Указывает индекс (1 на основе) первого результата поиска, возвращенного в этом наборе результатов.
RU Текст (целое число) Указывает индекс (1 на основе) последнего результата поиска, возвращаемый в этом наборе результатов.
Пример <Res sn = "1" en = "10">
Субтаги M , fi ?, XT ?, NB ?, R *
Подтаг ВСП
Формат контента Пустой

С
Определение

Тег <s> содержит отрыв для результатов поиска, который показывает термины запроса, выделенные жирным шрифтом. Разрывы в линии включены в выдержку для правильной обертывания текста.

Пример <s> Вашингтон (CNN) - попытка положить конец противостоянию в Сенате над президентом. Судебные выборы позволили бы пять кандидатов подняться до окончательного голосования при сохранении & lt; b & gt; ... & lt; b & gt; ... & lt;/b & gt; <s>
Подтаг р
Формат контента Текст (HTML)

Sl_main
Определение

Этот тег инкапсулирует содержимое результата продвижения по службе. Используйте для разбора рекламных акций. Якорный текст и URL ссылки на заголовок содержатся в подтэгах T и U соответственно. Линии текста тела и ссылки содержатся в подтэгах body_line .

Субтаги Body_line *, t , u
Подтаг Sl_results
Формат контента Пустой

Sl_results
Определение

Тег контейнера для продвижения результатов. Один из них появится всякий раз, когда у вас появляется продвижение в результатах поиска. Субтаг SL_MAIN содержит основные данные результата.

Субтаги Sl_main *
Подтаг р
Формат контента Пустой

Написание
Определение

Тег <plipling> инкапсулирует альтернативное предложение по написанию для написания представленного запроса. Этот тег появляется только на первой странице результатов поиска. Правописание предложения доступны на английском, китайском, японском и корейском.

ПРИМЕЧАНИЕ. Google будет возвращать только предложения по орфографии для запросов, где значение параметра GL составляет строчные буквы.

Пример <Правописание>
Субтаги Предположение
Подтаг ВСП
Формат контента Пустой

Предположение
Определение Тег <perfortion> содержит альтернативное предложение по орфографии для представленного запроса. Вы можете использовать контент тега, чтобы предложить альтернативное написание вашего пользователя поиска. Значением Q- атрибута является предложение по орфографии, которое вы можете использовать в качестве термина запроса.
Атрибуты
Имя Формат Описание
д Текст Атрибут Q указывает на URL-эскапированную версию предложения по орфографии.
Пример <Предложение Q = "Soccer"> & lt; b & gt; & lt; i & gt; футбол & lt;/i & gt; & lt;/b & gt; </propertion>
Подтаг Написание
Формат контента Текст (HTML)

Т
Определение Тег <t> содержит заголовок результата.
Пример <t> Пиццерия Амичи на восточном побережье </t>
Подтаг р
Формат контента Текст (HTML)

заголовок
Определение

Как ребенок <Stext> , тег <Title> содержит имя вашей программируемой поисковой системы.

Будучи ребенком <Caster> , тег <Title> предоставляет заголовок для набора аспектов.

Пример

Как ребенок <Stext>: <Title> Моя поисковая система </title>

В детстве <Facet>: <Title> Title </title>

Подтаг Контекст , аспект
Формат контента Текст

ТМ
Определение

Тег <tm> идентифицирует общее время сервера, необходимое для возврата результатов поиска, измеренное за секунды.

Пример <TM> 0,100445 </tm>
Подтаг ВСП
Формат контента Текст (номер с плавающей запятой)

ТТ
Определение Тег <tt> обеспечивает наконечник поиска.
Пример <tt> & lt; i & gt; tip: для большинства браузеров нажатие клавиши возврата дает те же результаты, что и нажатие кнопки поиска. & Lt;/i & gt; </tt>
Подтаг ВСП

ты
Определение Тег <u> обеспечивает URL -адрес результата поиска.
Пример <u> http://www.dominos.com/ </u>
Подтаг р
Формат контента Текст (абсолютный URL)

УД
Определение

Тег <ud> предоставляет URL-адрес кодированного IDN (международное доменное имя) для результатов поиска. Значение позволяет отображать домены с использованием локальных языков. Например, IDN-кодированный URL http: //www.%E8%8A%B1%E4%BA%95.com может быть декодирован и отображен как http: // www. 花井 .com . Этот тег <ud> будет включен только в результаты поиска для запросов, которые включали параметр UD .

Примечание: это бета -функция.

Пример <ud> http: //www.%E8%8A%B1%E4%BA%95.com/ </ud>
Подтаг р
Формат контента Текст (кодированный URL IDN)

УЭ
Определение Тег <ue> обеспечивает URL -адрес результата поиска. Значение с URL-эскапированием, так что оно подходит для прохождения в качестве параметра запроса в URL.
Пример <ue> http://www.dominos.com/ </ue>
Подтаг р
Формат контента Текст (URL-eceped URL)

ХТ
Определение Тег <tt> указывает на то, что оценочное общее количество результатов, указанных Tag M , фактически представляет точное общее количество результатов. См. Раздел автоматической фильтрации этого документа для получения более подробной информации.
Пример <Xt />
Подтаг ВИЭ
Формат контента Пустой


Результаты XML для запросов поиска изображения

Этот образец запроса изображения запрашивает 5 результатов (num = 5) о термине поиска «Обезьяна» (Q = обезьяна).

http://www.google.com/cse?
  searchtype=image
  &num=2
  &q=monkey
  &client=google-csbe
  &output=xml_no_dtd
  &cx=00255077836266642015:u-scht7a-8i

Этот запрос дает результат XML ниже.


<GSP VER="3.2">
  <TM>0.395037</TM>
  <Q>monkeys</Q>

  <PARAM name="cx" value="011737558837375720776:mbfrjmyam1g" original_value="011737558837375720776:mbfrjmyam1g" url_<escaped_value="011737558837375720776%3Ambfrjmyam1g" js_escaped_value="011737558837375720776:mbfrjmyam1g"/>
  <PARAM name="client" value="google-csbe" original_value="google-csbe" url_escaped_value="google-csbe" js_escaped_value="google-csbe"/>
  <PARAM name="q" value="monkeys" original_value="monkeys" url_escaped_value="monkeys" js_escaped_value="monkeys"/>
  <PARAM name="num" value="2" original_value="2" url_escaped_value="2" js_escaped_value="2"/>
  <PARAM name="output" value="xml_no_dtd" original_value="xml_no_dtd" url_escaped_value="xml_no_dtd" js_escaped_value="xml_no_dtd"/>
  <PARAM name="adkw" value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" original_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" url_escaped_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" js_escaped_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A"/>
  <PARAM name="hl" value="en" original_value="en" url_escaped_value="en" js_escaped_value="en"/>
  <PARAM name="oe" value="UTF-8" original_value="UTF-8" url_escaped_value="UTF-8" js_escaped_value="UTF-8"/>
  <PARAM name="ie" value="UTF-8" original_value="UTF-8" url_escaped_value="UTF-8" js_escaped_value="UTF-8"/>
  <PARAM name="boostcse" value="0" original_value="0" url_escaped_value="0" js_escaped_value="0"/>

  <Context>
    <title>domestigeek</title>
  </Context>

  <ARES/>
  <RES SN="1" EN="2">
    <M>2500000</M>
    <NB>
      <NU>/images?q=monkeys&num=2&hl=en&client=google-csbe&cx=011737558837375720776:mbfrjmyam1g&boostcse=0&output=xml_no_dtd
        &ie=UTF-8&oe=UTF-8&tbm=isch&ei=786oTsLiJaaFiALKrPChBg&start=2&sa=N
      </NU>
    </NB>
    <RG START="1" SIZE="2"/>
      <R N="1" MIME="image/jpeg">
        <RU>http://www.flickr.com/photos/fncll/135465558/</RU>
        <U>
          http://farm1.static.flickr.com/46/135465558_123402af8c.jpg
        </U>
        <UE>
          http://farm1.static.flickr.com/46/135465558_123402af8c.jpg
        </UE>
        <T>Computer <b>Monkeys</b> | Flickr - Photo Sharing!</T>
        <RK>0</RK>
        <BYLINEDATE>1146034800</BYLINEDATE>
        <S>Computer <b>Monkeys</b> | Flickr</S>
        <LANG>en</LANG>
        <IMG WH="500" HT="305" IID="ANd9GcQARKLwzi-t4lpWi2AERV3kJb4ansaQzTn3MNDZR9fD_JDiktPKByKUBLs">
          <SZ>88386</SZ>
          <IN/>
        </IMG>
        <TBN TYPE="0" WH="130" HT="79" URL="http://t0.gstatic.com/images?q=tbn:ANd9GcQARKLwzi-
t4lpWi2AERV3kJb4ansaQzTn3MNDZR9fD_JDiktPKByKUBLs"/>
      </R>
      <R N="2" MIME="image/jpeg">
        <RU>
          http://www.flickr.com/photos/flickerbulb/187044366/
        </RU>
        <U>
          http://farm1.static.flickr.com/73/187044366_506a1933f4.jpg
        </U>
        <UE>
          http://farm1.static.flickr.com/73/187044366_506a1933f4.jpg
        </UE>
        <T>
          one. ugly. <b>monkey</b>. | Flickr - Photo Sharing!
        </T>
        <RK>0</RK>
        <BYLINEDATE>1152514800</BYLINEDATE>
        <S>one. ugly. <b>monkey</b>.</S>
        <LANG>en</LANG>
        <IMG WH="400" HT="481" IID="ANd9GcQ3Qom0bYbee4fThCQVi96jMEwMU6IvVf2b8K5vERKVw-
           EF4tQQnDDKOq0"><SZ>58339</SZ>
          <IN/>
        </IMG>
        <TBN TYPE="0" WH="107" HT="129" URL="http://t1.gstatic.com/images?q=tbn:ANd9GcQ3Qom0bYbee4fThCQ
          Vi96jMEwMU6IvVf2b8K5vERKVw-EF4tQQnDDKOq0"/>
      </R>
  </RES>
</GSP>

Поиск изображения: теги XML

В таблице ниже показаны дополнительные теги XML, используемые в ответах XML для запросов поиска изображения.

Некоторые символы могут отображаться рядом с некоторыми подтуями в приведенных ниже определениях. Эти символы и их значения:

? = необязательный подтхт
* = ноль или более экземпляров субтага
+ = один или несколько случаев субтага

РГ
Определение

Тег <rg> прилагает детали отдельного результата поиска изображения.

Атрибуты
Имя Формат Описание
Н Текст (целое число) Указывает индекс (1 на основе) этого результата поиска.
Мима Текст Указывает тип MIME результата поиска.
Подтаг ВИЭ
RU
Определение

Тег <ru tag> прилагает подробную информацию о каждом результате поиска изображения.

Подтаг р