XML API リファレンス

このページでは、Google Site Search をご利用のお客様のみが利用できる Custom Search JSON API の XML バージョンについて説明します。

  1. 概要
  2. プログラム可能検索エンジンのリクエスト形式
    1. リクエストの概要
    2. 検索語句
    3. リクエスト パラメータ
      1. WebSearch クエリのサンプル
      2. WebSearch のクエリ パラメータの定義
      3. 検索オプション
      4. 検索オプションのクエリ パラメータ
      5. 特別な検索語句
      6. 画像検索のサンプル
      7. 画像検索のクエリ パラメータ
      8. リクエストの上限
    4. クエリと結果の表示の多言語化
      1. 文字エンコード
      2. インターフェース言語
      3. 中国語(簡体字、繁体字)の検索
    5. 結果をフィルタする
      1. 検索結果の自動フィルタリング
      2. 言語と国のフィルタリング
      3. セーフサーチによるアダルト コンテンツのフィルタリング
  3. XML 結果
    1. Google XML 結果 DTD
    2. XML レスポンスについて
    3. 標準、画像、高度な検索クエリの XML 結果
      1. 標準検索/詳細検索: サンプルクエリと XML 形式の結果
      2. 標準検索/検索オプション: XML タグ
      3. 画像検索クエリの XML 結果
      4. 画像検索: サンプルクエリと XML 結果
      5. 画像検索: XML タグ

概要

Google ウェブ検索サービスを使用すると、Google サイト内検索を使用して、自社のウェブサイトに Google 検索結果を表示できます。WS サービスでは、シンプルな HTTP ベースのプロトコルを使用して検索結果を提供します。検索管理者は、検索結果をリクエストする方法と、エンドユーザーに結果を表示する方法を完全に制御できます。このドキュメントでは、Google 検索リクエストと結果の形式に関する技術的な詳細について説明します。

Google ウェブ検索の結果を取得するには、アプリケーションから Google にシンプルな HTTP リクエストを送信します。この場合、Google は検索結果を XML 形式で返します。XML 形式の結果では、検索結果の表示方法をカスタマイズできます。

WebSearch リクエストの形式

リクエストの概要

Google 検索リクエストは標準の HTTP GET コマンドです。これには、クエリに関連する一連のパラメータが含まれます。これらのパラメータは、アンパサンド(&)文字で区切られた name=value のペアとしてリクエスト URL に含まれます。パラメータには、検索クエリなどのデータや、HTTP リクエストを行うエンジンを識別する一意のエンジン ID(cx)が含まれます。ウェブ検索サービスまたは画像検索サービスが、HTTP リクエストに応じて XML 結果を返します。

クエリ語句

ほとんどの場合、検索リクエストには 1 つ以上の検索キーワードが含まれます。クエリ語句は、検索リクエスト内のパラメータの値として表示されます。

検索キーワードでは、Google が返す検索結果をフィルタリング、整理するために、いくつかのタイプの情報を指定できます。クエリでは以下を指定できます。

  • 追加または除外する単語やフレーズ
    • 検索クエリ内のすべての単語(デフォルト)
    • 検索クエリ内の完全一致フレーズ
    • 検索クエリ内の任意の単語やフレーズ
  • 検索キーワードを確認するドキュメント内の場所
    • ドキュメント内の任意の場所(デフォルト)
    • ドキュメントの本文のみ
    • ドキュメントのタイトルのみ
    • ドキュメントの URL 内のみ
    • ドキュメント内のリンクのみ
  • 書類自体に対する制限
    • 特定のファイル形式のドキュメント(PDF ファイルや Word 文書など)を追加または除外する
  • 検索ではなく、指定された URL に関する情報を返す特別な URL クエリ
    • Open Directory のカテゴリ、スニペット、言語など、URL に関する一般的な情報を返すクエリ
    • URL にリンクしているウェブページのセットを返すクエリ
    • 指定した URL に類似したウェブページを返すクエリ

デフォルトの検索

検索クエリのパラメータ値は、URL エスケープされる必要があります。検索クエリ内の空白文字をプラス記号(+)で置き換えることができます。詳細については、このドキュメントの URL のエスケープ セクションをご覧ください。

検索クエリは、q パラメータを使用して WebSearch サービスに送信されます。検索クエリの語句の例を次に示します。

q=horses+cows+pigs

Google WS サービスはデフォルトで、検索クエリ内のすべてのキーワードを含むドキュメントのみを返します。

リクエスト パラメータ

このセクションでは、検索リクエストの作成時に使用できるパラメータについて説明します。パラメータは 2 つのリストに分かれています。最初のリストには、すべての検索リクエストに関連するパラメータが含まれています。2 番目のリストには、検索オプション リクエストだけに関連するパラメータが含まれています。

次の 3 つのリクエスト パラメータが必要です。

  • client パラメータは google-csbe に設定する必要があります。
  • output パラメータでは、返される XML 結果の形式を指定します。結果は、Google の DTD への参照を含む場合(xml)を指定する場合となし(xml_no_dtd)のどちらで返すこともできます。この値は xml_no_dtd に設定することをおすすめします。注: このパラメータを指定しない場合、結果は XML ではなく HTML で返されます。
  • cx パラメータ。エンジンの一意の ID を表します。

上記以外によく使用されるリクエスト パラメータは次のとおりです。

  • num - リクエストされた検索結果の数
  • q - 検索キーワード
  • start - 結果の開始インデックス。

ウェブ検索クエリのサンプル

以下の例は、いくつかの WebSearch HTTP リクエストを示し、さまざまなクエリ パラメータがどのように使用されるかを示しています。各クエリ パラメータの定義については、このドキュメントの WebSearch クエリ パラメータの定義詳細検索クエリパラメータのセクションをご覧ください。

このリクエストは、クエリ語句「red sox」(q=red+sox)の最初の 10 件の結果(start=0&num=10)を要求します。このクエリは、カナダのウェブサイト(cr=countryCA)から取得し、フランス語(lr=lang_fr)で記述することを指定します。最後に、clientoutput パラメータ、cx パラメータの値を指定します。この 3 つはすべて必須です。

http://www.google.com/search?
start=0
&num=10
&q=red+sox
&cr=countryCA
&lr=lang_fr
&client=google-csbe
&output=xml_no_dtd
&cx=00255077836266642015:u-scht7a-8i

この例では、高度な検索クエリパラメータの一部を使用して、検索クエリをさらにカスタマイズしています。このリクエストでは、q パラメータの代わりに as_q パラメータ(as_q=red+sox)を使用します。また、as_eq パラメータを使用して、「Yankees」という単語を含むドキュメントをすべて検索結果(as_eq=yankees)から除外します。

http://www.google.com/search?
start=0
&num=10
&as_q=red+sox
&as_eq=Yankees
&client=google-csbe
&output=xml_no_dtd
&cx=00255077836266642015:u-scht7a-8i

WebSearch のクエリ パラメータの定義

c2coff
Description

省略可。c2coff パラメータは、簡体字中国語検索と繁体字中国語検索機能を有効または無効にします。

このパラメータのデフォルト値は 0(ゼロ)であり、機能が有効になっていることを意味します。c2coff パラメータの値は次のとおりです。

アクション
1 無効
0 有効
q=google&c2coff=1

クライアント
Description

必須client パラメータは google-csbe に設定する必要があります。

q=google&client=google-csbe

cr
Description

省略可。cr パラメータを使用すると、検索結果を特定の国のドキュメントに限定できます。cr パラメータの値には、ブール演算子を使用できます。

Google WS はドキュメントの国を次の方法で分析します。

  • ドキュメントの URL のトップレベル ドメイン(TLD)
  • ウェブサーバーの IP アドレスの地理的位置

このパラメータの有効な値のリストについては、Country(cr)パラメータ値をご覧ください。

q=Frodo&cr=countryNZ

cx
Description

必須cx パラメータには、カスタム検索エンジンを識別する一意のコードを指定します。検索エンジンから検索結果を取得するには、cx パラメータを使用してプログラム可能検索エンジンを指定する必要があります。

cx パラメータの値を確認するには、エンジンの [コントロール パネル] > [コード] タブを開きます。[コード] は、検索ボックスを表示するページの [このコードを貼り付け] のテキスト領域にあります。検索結果は Google がホストするページに表示されます。

q=Frodo&cx=00255077836266642015:u-scht7a-8i

フィルタ
Description

省略可。filter パラメータは、Google 検索の検索結果の自動フィルタリングを有効または無効にします。Google の検索結果フィルタの詳細については、このドキュメントの自動フィルタリングのセクションをご覧ください。

filter パラメータのデフォルト値は 1 で、この機能が有効になっていることを示します。このパラメータの有効な値は次のとおりです。

アクション
1 無効
0 有効

注: デフォルトでは、検索結果の品質を高めるため、すべての検索結果にフィルタリングが適用されます。

q=google&filter=0

gl
Description

省略可。gl パラメータ値は 2 文字の国コードです。ウェブ検索の結果では、gl パラメータにより、元の国がパラメータ値と一致する検索結果が優先的に表示されます。有効な値のリストについては、国コードをご覧ください。

WebSearch リクエストに gl パラメータ値を指定すると、結果の関連性が向上します。これは特に海外のお客様、特に英語圏の米国以外の国のお客様の場合です。

このリクエストでは、英国で書かれたドキュメントがウェブ検索結果に表示されます。
q=pizza&gl=uk


hl
Description

省略可。hl パラメータは、ユーザー インターフェースのインターフェース言語(ホスト言語)を指定します。検索結果のパフォーマンスと品質を向上させるには、このパラメータを明示的に設定することを強くおすすめします。

詳細については、クエリと結果の表示の国際化インターフェース言語のセクションをご覧ください。サポートされている言語の一覧については、サポートされているインターフェース言語をご覧ください。

このリクエストでは、フランス語のワインの広告がターゲットに設定されます。(Vin はフランス語でワインを表します)。

q=vin&ip=10.10.10.10&ad=w5&hl=fr

hq
Description

省略可。hq パラメータは、指定されたクエリ語句を、論理 AND 演算子で結合されているかのようにクエリに追加します。

このリクエストでは、「ピザ」と「チーズ」を検索します。この式は q=pizza+cheese と同じです。

q=pizza&hq=cheese


ie
Description

省略可。ie パラメータでは、クエリ文字列の解釈に使用する文字エンコード スキームを設定します。ie のデフォルト値は latin1 です。

このパラメータを使用する必要がある状況については、文字エンコードセクションをご覧ください。

使用可能な ie 値のリストについては、文字エンコード スキームセクションをご覧ください。

q=google&ie=utf8&oe=utf8
lr
Description

省略可。lr(言語制限)パラメータは、特定の言語で記述されたドキュメントのみに検索結果を制限します。

Google WS はドキュメントの言語を次の方法で分析します。

  • ドキュメントの URL のトップレベル ドメイン(TLD)
  • ドキュメント内の言語メタタグ
  • ドキュメントの本文で使用される主な言語
  • ドキュメントの本文で使用される二次言語(存在する場合)

このパラメータの有効な値の一覧については、言語(lr)コレクション値のセクションをご覧ください。

q=Frodo&lr=lang_en

num
Description

省略可。num パラメータは、返される検索結果の数を指定します。

num のデフォルト値は 10、最大値は 20 です。20 個を超える結果をリクエストすると、20 個のみの結果が返されます。

注: 検索結果の合計数がリクエストした結果の数より少ない場合、利用可能なすべての検索結果が返されます。

q=google&num=10

oe
Description

省略可。oe パラメータでは、XML 結果のデコードに使用する文字エンコード スキームを設定します。oe のデフォルト値は latin1 です。

このパラメータを使用する必要がある状況については、文字エンコードセクションをご覧ください。

使用可能な oe 値のリストについては、文字エンコード スキームセクションをご覧ください。

q=google&ie=utf8&oe=utf8

出力
Description

必須output パラメータは、XML 結果の形式を指定します。このパラメータで有効な値は xmlxml_no_dtd のみです。以下の表に、これらのパラメータ値の違いを示します。

出力形式
xml_no_dtd XML の結果に !DOCTYPE ステートメントは含まれません。(推奨)
xml XML の結果には Google DTD 参照が含まれます。結果の 2 行目には、結果で使用されるドキュメント定義タイプ(DTD)が示されています(
    <!DOCTYPE GSP SYSTEM "google.dtd">
)。
output=xml_no_dtd
output=xml

q
Description

省略可。q パラメータは、ユーザーが入力した検索クエリを指定します。このパラメータは省略可能ですが、検索結果を取得するには、少なくとも 1 つのクエリ パラメータ(as_epqas_lqas_oqas_q)の値を指定する必要があります。

q パラメータの値の一部として使用できる、いくつかの特別なクエリ用語もあります。これらの用語のリストと定義については、特別な検索キーワード用語をご覧ください。

Google 検索コントロール パネルには、q パラメータで送信された上位のクエリのレポートが表示されます。

注: q パラメータに指定する値は、URL エスケープする必要があります。

q=vacation&as_oq=london+paris

安全
Description

省略可。safe パラメータは、アダルト コンテンツとポルノ コンテンツに関する検索結果をフィルタする方法を示します。safe パラメータのデフォルト値は off です。有効なパラメータ値は次のとおりです。

アクション
off セーフサーチを無効にする
medium セーフサーチを有効にする
high セーフサーチのより厳密なバージョンを有効にする

この機能について詳しくは、セーフサーチによるアダルト コンテンツのフィルタリングをご覧ください。

q=adult&safe=high

開始
Description

省略可。start パラメータは、検索結果に含めるべき最初の一致結果を示します。start パラメータはゼロベースのインデックスを使用します。つまり、最初の結果は 0、2 番目の結果は 1 になります。

start パラメータは、num パラメータと組み合わせて使用し、どの検索結果を返すかを決定します。1,000 を超えるドキュメントがクエリに一致する場合でも、1 つのクエリで返される結果は 1,000 件までです。したがって、start を 1,000 以上に設定しても結果は生成されません。

start=10

sort
Description

省略可。sort パラメータは、指定された式に従って結果が並べ替えられることを指定します。たとえば、日付で並べ替えます。

sort=date


Ud
Description

省略可。ud パラメータは、IDN エンコードされた検索結果の URL を XML レスポンスに含める必要があるかどうかを示します。IDN(国際ドメイン名)エンコードを使用すると、ローカル言語でドメインを表示できます。次に例を示します。

http://www.花井鮨.com

このパラメータの有効な値は 1(デフォルト)で、XML 結果には IDN エンコード URL と 0 が含まれます(XML 結果には IDN エンコード URL は含まれません)。ud パラメータが 1 に設定されている場合、IDN エンコード URL は XML 結果の UD タグに表示されます。

ud パラメータが 0 に設定されている場合、上記の例の URL は次のようになります。

http://www.xn--elq438j.com.

注: これはベータ版の機能です。

q=google&ud=1

画像の下にリストされている追加のクエリ パラメータは、高度な検索クエリに関連しています。 検索オプションを送信すると、複数のパラメータの値(as_eqas_epqas_oq など)はすべて、その検索のクエリ語句に組み込まれます。この画像は、Google の検索オプション ページを示しています。この画像では、各検索オプション パラメータの名前が、該当するページのフィールド内または横にredのテキストで表示されています。



検索オプション パラメータ

as_dt
Description

省略可。as_dt パラメータは、as_sitesearch パラメータで指定したサイトの結果を含めるか除外するかを制御します。値 ie は、それぞれ包含と除外を示します。

as_dt=i,as_dt=e

as_epq
Description

省略可。as_epq パラメータは、検索結果内のすべてのドキュメントに含まれるフレーズを指定します。フレーズ検索のクエリ語句を使用してフレーズを検索することもできます。

as_epq=abraham+lincoln

as_eq
Description

省略可。as_eq パラメータは、検索結果のドキュメントに表示されない単語またはフレーズを指定します。また、特定の単語またはフレーズが一連の検索結果内のドキュメントに表示されないように、除外クエリ語句を使用することもできます。

q=bass&as_eq=music.


as_lq
Description

省略可。as_lq パラメータでは、すべての検索結果に特定の URL へのリンクが含まれる必要があることを指定します。このタイプのクエリには、link: クエリ用語を使用することもできます。

as_lq=www.google.com


as_nlo
Description

省略可。as_nlo パラメータは、検索範囲の開始値を指定します。as_nloas_nhi を使用して、as_nlo...as_nhi の包括的な検索範囲をクエリに追加します。

以下では、検索範囲を 5 ~ 10 に設定します。

as_nlo=5&as_nhi=10

as_nhi
Description

省略可。as_nhi パラメータは、検索範囲の終了値を指定します。as_nloas_nhi を使用して、as_nlo...as_nhi の包括的な検索範囲をクエリに追加します。

以下では、検索範囲を 5 ~ 10 に設定します。

as_nlo=5&as_nhi=10

as_oq
Description

省略可。as_oq パラメータでは、ドキュメント内をチェックする追加の検索キーワードを指定できます。検索結果の各ドキュメントには、追加の検索キーワードが 1 つ以上含まれている必要があります。このタイプのクエリには、ブール値 OR のクエリ語句を使用することもできます。

q=vacation&as_oq=London+Paris


as_q
Description

省略可。as_q パラメータでは、ドキュメント内をチェックする検索キーワードを指定します。このパラメータは、ユーザーが検索結果セット内で検索する追加の用語を指定できるようにするためにもよく使用されます。

q=president&as_q=John+Adams


as_qdr
Description

省略可。as_qdr パラメータは、指定された期間(簡単な期間)の検索結果をリクエストします。サポートされる値は次のとおりです。

d[number] は、指定した過去の日数の結果をリクエストします。
w[number] は、指定された過去の週数の結果をリクエストします。
m[number] は、指定された過去の月数の結果をリクエストします。
y[number] は、指定された過去の年数の結果をリクエストします。

この例では、過去 1 年の結果をリクエストしています。

as_qdr=y

この例では、過去 10 日間の結果をリクエストしています。

as_qdr=d10

as_sitesearch
Description

省略可。as_sitesearch パラメータを使用すると、すべての検索結果を特定のサイトのページとするよう指定できます。as_dt パラメータを設定すると、指定したサイトのページを検索結果から除外することもできます。

q=vacation&as_sitesearch=www.google.com


特別な検索語句

Google ウェブ検索では、Google 検索エンジンの追加機能にアクセスできる、いくつかの特別な検索キーワードを使用できます。こうした特別なクエリ語句は、リクエスト パラメータの値の q に含める必要があります。他のクエリ語句と同様に、特殊なクエリ語句は URL エスケープする必要があります。多くの特殊なクエリ語句にはコロン(:)が含まれます。この文字は URL エスケープする必要があります。また、URL エスケープされた値は %3A です。

バックリンク [link:]
Description

link: クエリ語句は、特定の URL にリンクしているウェブページのセットを取得します。検索クエリは、link:URL の形式にする必要があります。link: のクエリ語句と URL の間にスペースを入れないでください。

link: の URL エスケープ バージョンは link%3A です。

また、as_lq リクエスト パラメータを使用して link: リクエストを送信することもできます。

注: link: を使用する場合、他のクエリ語句は指定できません。

http://www.google.com/search?q=link%3Awww.example.com


ブール値 OR 検索 [ OR ]
Description

OR クエリ語句は、一連の(2 つ以上)のクエリ語句の 1 つを含むドキュメントを取得します。OR クエリ語句を使用するには、一連の各語句の間に検索キーワード OR を大文字で挿入します。

また、as_oq リクエスト パラメータを使用して、一連の語句のうち任意の語句の検索を送信することもできます。

注: 検索リクエストに「London+OR+Paris」というクエリを指定すると、この 2 つの単語のうち少なくとも 1 つを含むドキュメントが検索結果に含まれます。場合によっては、検索結果のドキュメントに両方の単語が含まれていることもあります。

ロンドンまたはパリを検索します。

ユーザー入力:london OR paris クエリ語句:q=london+OR+paris

「休暇」と「ロンドン」または「パリ」を検索します。

クエリ用語:q=vacation+london+OR+paris

休暇とロンドン、パリ、またはチョコレートのいずれかを検索します。

クエリ用語:  q=vacation+london+OR+paris+OR+chocolates

「休暇」と「チョコレート」、そして「ロンドンまたはパリ」を検索します。最も重みが小さいのはチョコレートです。

クエリ用語:  q=vacation+london+OR+paris+chocolates

ロンドンまたはパリのいずれかを含むドキュメントから休暇、チョコレート、花を検索します。

クエリ用語:  q=vacation+london+OR+paris+chocolates+flowers

「休暇」と「ロンドンまたはパリ」で検索し、さらに「チョコレート」または「花」も検索します。

クエリ用語:  q=vacation+london+OR+paris+chocolates+OR+flowers

検索語句を除外 [-]
Description

除外(-)クエリは、特定の検索リクエストの結果を、特定の単語やフレーズを含まないドキュメントに制限します。除外クエリ用語を使用するには、一致するドキュメントから除外する単語またはフレーズの前に「-」(マイナス記号)を付けます。

- の URL エスケープ バージョンは %2D です。

除外クエリ語句は、検索キーワードに複数の意味がある場合に役立ちます。たとえば、「bass」という単語に対しては、魚や音楽に関する結果を返すことができます。fish に関するドキュメントを検索する場合、「exclude」クエリ語句を使用することで、音楽に関するドキュメントを検索結果から除外できます。

また、as_eq リクエスト パラメータを使用して、特定の単語やフレーズに一致するドキュメントを検索結果から除外することもできます。

ユーザー入力: bass -music
クエリ語句: q=bass+%2Dmusic

ファイル形式の除外 [ -filetype: ]
Description

-filetype: というクエリ語句は、特定のファイル拡張子(「.pdf」や「.doc」など)を持つドキュメントを検索結果から除外します。検索クエリは、-filetype: クエリ語句と指定した拡張子の間にスペースを入れずに、-filetype:EXTENSION の形式にする必要があります。

-filetype: の URL エスケープ バージョンは %2Dfiletype%3A です。

注: クエリに -filetype: クエリ語句を追加すると、複数のファイル形式を検索結果から除外できます。検索結果から除外するファイル拡張子ごとに、検索クエリに -filetype: クエリ語句を 1 つ含める必要があります。

Google でサポートされているファイル形式は次のとおりです。

  • Adobe Portable Document Format(PDF)
  • Adobe PostScript(ps)
  • ロータス 1-2-3(wk1、wk2、wk3、wk4、wk5、wki、wks、wku)
  • ロータス WordPro(lwp)
  • マクライト(mw)
  • Microsoft Excel(xls)
  • Microsoft PowerPoint(ppt)
  • Microsoft Word(ドキュメント)
  • Microsoft Works(wks、wps、wdb)
  • Microsoft Write(wri)
  • リッチテキスト形式(rtf)
  • ShockWave Flash(swf)
  • テキスト(ans、txt)。

今後、ファイル形式が追加される可能性があります。最新のリストについては、Google のファイル形式に関するよくある質問をご覧ください。

この例では、「Google」と記述されているが PDF ドキュメントではないドキュメントを返します。
q=Google+%2Dfiletype%3Apdf

この例では、「Google」という単語を含むドキュメントを返しますが、PDF と Word の両方のドキュメントは除外されます。
q=Google+%2Dfiletype%3Apdf+%2Dfiletype%3Adoc


ファイル形式のフィルタリング [ filetype: ]
Description

filetype: という検索キーワードを使用すると、検索結果が特定のファイル拡張子を持つドキュメント(「.pdf」や「.doc」など)に限定されます。 検索クエリは、filetype:EXTENSION の形式にする必要があります。filetype: クエリ語句と指定した拡張子の間にスペースを入れないでください。

filetype: の URL エスケープ バージョンは filetype%3A です。

クエリに filetype: クエリ語句を追加すると、検索結果を複数のファイル拡張子のいずれかに一致するドキュメントに限定できます。検索結果に含めるファイル拡張子ごとに、検索クエリに filetype: 検索キーワードを 1 つ含める必要があります。複数の filetype: クエリ語句は、OR クエリ語句を使用して区切る必要があります。

デフォルトでは、任意のファイル拡張子のドキュメントが検索結果に含まれます。

Google でサポートされているファイル形式は次のとおりです。

  • Adobe Portable Document Format(PDF)
  • Adobe PostScript(ps)
  • ロータス 1-2-3(wk1、wk2、wk3、wk4、wk5、wki、wks、wku)
  • ロータス WordPro(lwp)
  • マクライト(mw)
  • Microsoft Excel(xls)
  • Microsoft PowerPoint(ppt)
  • Microsoft Word(ドキュメント)
  • Microsoft Works(wks、wps、wdb)
  • Microsoft Write(wri)
  • リッチテキスト形式(rtf)
  • ShockWave Flash(swf)
  • テキスト(ans、txt)。

今後、ファイル形式が追加される可能性があります。最新のリストについては、Google のファイル形式に関するよくある質問をご覧ください。

この例は、「Google」が含まれる PDF ドキュメントを返します。
q=Google+filetype%3Apdf

この例は、「Google」が含まれる PDF と Word ドキュメントを返します。
q=Google+filetype%3Apdf+OR+filetype%3Adoc


検索語句を含める [+]
Description

含む(+)クエリ語句は、単語またはフレーズが検索結果に含まれるすべてのドキュメントに存在する必要があることを示します。クエリ語句を含めるには、すべての検索結果に含める必要がある単語またはフレーズの前に「+」(プラス記号)を付けます。

+(プラス記号)の URL エスケープされたバージョンは %2B です。

+ は、検索結果を特定する前に、Google では通常破棄される一般的な単語の前に使用してください。

ユーザー入力: Star Wars Episode +I
クエリ語句: q=Star+Wars+Episode+%2BI

リンクのみ: 検索、すべてのキーワード [ allinlinks: ]
Description

allinlinks: クエリ語句は、検索結果内のドキュメントに、URL リンク内の検索クエリ内のすべての単語が含まれている必要があります。検索クエリは、allinlinks: の後に検索クエリ内の単語を付加した形式で指定する必要があります。

検索クエリに allinlinks: クエリ語句が含まれている場合、Google は検索クエリ内の単語について、ドキュメント内の URL リンクのみを確認します。ドキュメント内の他のテキスト、ドキュメントのタイトル、各ドキュメントの URL は無視されます。ドキュメントの URL は、ドキュメントに含まれる URL リンクとは異なることに注意してください。

allinlinks: の URL エスケープ バージョンは allinlinks%3A です。

ユーザー入力:allinlinks: Google search
クエリ語句:q=allinlinks%3A+Google+search

フレーズ検索
Description

フレーズ検索(")クエリ用語を使用すると、フレーズを引用符で囲むか、ハイフンで囲むことで、完全なフレーズを検索できます。

"(引用符)の URL エスケープ バージョンは %22 です。

フレーズ検索は、有名な引用や固有名詞を検索する場合に特に便利です。

as_epq リクエスト パラメータを使用してフレーズ検索を送信することもできます。

ユーザー入力:"Abraham Lincoln"
クエリ語句: q=%22Abraham+Lincoln%22

テキストのみの検索、すべての語句 [allintext:]
Description

allintext: クエリ語句は、検索結果の各ドキュメントに、そのドキュメントの本文内の検索クエリの単語がすべて含まれている必要があります。クエリは allintext: の形式で、その後に検索クエリ内の単語を続ける必要があります。

検索クエリに allintext: クエリ語句が含まれている場合、Google はドキュメントの本文でのみ検索クエリの単語を確認し、ドキュメント内のリンク、ドキュメントのタイトル、ドキュメントの URL を無視します。

allintext: の URL エスケープ バージョンは allintext%3A です。

この例では、検索結果に含まれるすべてのドキュメントの本文に「Google」と「検索」という単語が含まれる必要があることを指定しています。
ユーザー入力:allintext:Google search
検索語句:q=allintext%3AGoogle+search

タイトル検索、1 つの語句 [intitle:]
Description

intitle: というクエリ語句は、検索結果を、ドキュメントのタイトルに特定の単語を含むドキュメントに限定します。検索クエリは、intitle:WORD の形式にする必要があります。intitle: クエリ語句と次の単語の間にスペースは入れません。

注: ドキュメントのタイトルに複数の単語を含めるには、各単語の前に intitle: クエリ語句を追加します。また、allintitle: というクエリ語句を使用して、検索結果内のドキュメントのタイトルにすべてのクエリ語句を含めるように指定することもできます。

intitle: の URL エスケープ バージョンは intitle%3A です。

この例では、検索結果内のドキュメントのタイトルに「Google」という単語が表示され、ドキュメントのタイトル、URL、リンク、本文テキストのいずれかの場所に「検索」という単語が含まれることを指定します。
ユーザー入力:intitle:Google search
検索語句:q=intitle%3AGoogle+search


タイトル検索、すべての語句 [allintitle:]
Description

allintitle: クエリ語句は、検索結果を、ドキュメントのタイトルにクエリ語句をすべて含むドキュメントに限定します。allintitle: クエリ語句を使用するには、検索クエリの先頭に「allintitle:」を含めます。

注: 検索クエリの先頭に allintitle: を記述することは、検索クエリ内の各単語の前に intitle: を付けるのと同じです。

allintitle: の URL エスケープされたバージョンは allintitle%3A です。

この例では、検索結果のドキュメントのタイトルに「Google」と「検索」という単語が含まれる必要があることを指定しています。
ユーザー入力: allintitle: Google search
クエリ語句: q=allintitle%3A+Google+search


URL 検索、1 つのキーワード [inurl:]
Description

inurl: というクエリ語句は、検索結果をドキュメントの URL に特定の単語を含むドキュメントに限定します。検索クエリは、inurl:WORD 形式で、inurl: クエリ語句と次の単語の間にスペースを入れない必要があります。

inurl: クエリ語句は句読点を無視し、inurl: 演算子の後の最初の単語のみを使用します。ドキュメントの URL に含める必要がある複数の単語を指定するには、各単語の前に inurl: クエリ語句を挿入します。また、allinurl: というクエリ語句を使用して、検索結果に表示されるドキュメントの URL にすべてのクエリ語句を含めるように指定することもできます。

inurl: の URL エスケープ バージョンは inurl%3A です。

この例では、検索結果のドキュメントの URL に「Google」という単語が表示され、ドキュメントのタイトル、URL、リンク、本文のいずれかの場所に「検索」という単語が含まれることを指定します。
ユーザー入力: inurl:Google search
検索語句: q=inurl%3AGoogle+search


URL 検索、すべてのキーワード [allinurl:]
Description

allinurl: クエリ語句は、検索結果を、ドキュメント URL 内のクエリ語句をすべて含むドキュメントに限定します。allinurl: クエリ語句を使用するには、検索クエリの先頭に allinurl: を含めます。

allinurl: クエリ語句は句読点が無視されるため、語句に対してのみ機能します。URL コンポーネントに対しては機能しません。たとえば allinurl: uk/scotland と指定すると、URL に「uk」と「scotland」という単語を含むドキュメントのみが返されますが、この 2 つの単語が特定の順序で出現したり、スラッシュで区切られたりする必要はなくなります。

allinurl: の URL エスケープ バージョンは allinurl%3A です。

この例では、検索結果のドキュメントの URL に「Google」と「検索」という単語が含まれる必要があることを指定しています。
ユーザー入力: allinurl: Google search
クエリ語句: q=allinurl%3A+Google+search



ウェブ ドキュメント情報 [info:]
Description

info: というクエリ語句は、URL が Google の検索インデックスに含まれている限り、その URL に関する一般情報を取得します。検索クエリは、info: クエリ語句と URL の間にスペースを入れずに、info:URL の形式にする必要があります。

info: の URL エスケープ バージョンは info%3A です。

注: info: を使用する場合、他のクエリ語句は指定できません。

ユーザー入力: info:www.google.com
クエリ語句: q=info%3Awww.google.com

画像検索のクエリの例

以下の例は、異なるクエリ パラメータがどのように使用されるかを示すため、いくつかの Image HTTP リクエストを示しています。さまざまなクエリ パラメータの定義については、このドキュメントの画像クエリ パラメータの定義をご覧ください。

このリクエストでは、ファイル形式が .png の検索語句「monkey」(q=monkey)の最初の 5 つの結果(start=0&num=5)をリクエストしています。最後に、clientoutputcx の各パラメータの値を指定します。これら 3 つはすべて必須です。

http://www.google.com/cse?
  searchtype=image
  start=0
  &num=5
  &q=monkey
  &as_filetype=png
  &client=google-csbe
  &output=xml_no_dtd
  &cx=00255077836266642015:u-scht7a-8i

画像検索のクエリ パラメータ

as_filetype
Description

省略可。指定されたタイプの画像を返します。使用できる値は bmpgifpngjpgsvg です。

q=google&as_filetype=png

画像
Description

省略可。指定されたサイズの画像を返します。サイズは次のいずれかです。

  • icon(小)
  • small|medium|large|xlarge(中)
  • xxlarge(大)
  • huge(特大)

q=google&as_filetype=png&imgsz=icon

画像の種類
Description

省略可。次のいずれかの型の画像を返します。

  • clipart(クリップアート)
  • face(顔)
  • lineart(リニア)
  • news(ニュース)
  • photo(写真)

q=google&as_filetype=png&imgtype=photo

画像
Description

省略可。モノクロ画像、グレースケール画像、カラー画像を返します。

  • mono(モノクロ)
  • gray(グレースケール)
  • color(色)

q=google&as_filetype=png&imgc=gray

画像の色
Description

省略可。特定のドミナント カラーの画像を返します。

  • yellow
  • green
  • teal
  • blue
  • purple
  • pink
  • white
  • gray
  • black
  • brown
q=google&as_filetype=png&imgcolor=yellow

as_rights
Description

省略可。ライセンスに基づくフィルタ。指定できる値は次のとおりです。

  • cc_publicdomain
  • cc_attribute
  • cc_sharealike
  • cc_noncommercial
  • cc_nonderived

q=cats&as_filetype=png&as_rights=cc_attribute

リクエストの上限

次の表に、Google に送信する検索リクエストの制限を示します。

コンポーネント 上限 コメント
検索リクエストの長さ 2,048 バイト  
クエリ語句の数 10 次のパラメータの用語が含まれます: qas_epqas_eqas_lqas_oqas_q
検索結果の表示件数 20 num パラメータを 20 より大きい数値に設定すると、20 個の結果のみが返されます。これより多くの結果を得るには、複数のリクエストを送信し、リクエストごとに start パラメータの値を増やします。

クエリと結果の表示の多言語化

Google WS サービスを使用すると、複数の言語でドキュメントを検索できます。HTTP リクエストの解釈と XML レスポンスのエンコードに使用する文字エンコードを指定できます(ieoe 検索パラメータを使用)。特定の言語で書かれたドキュメントのみが含まれるように結果をフィルタすることもできます。

以下のセクションでは、複数の言語での検索に関する問題について説明します。

文字エンコード

サーバーは、ウェブページなどのデータを、エンコードされたバイトのシーケンスとして、ブラウザなどのユーザー エージェントに送信します。ユーザー エージェントは、このバイトを一連の文字にデコードします。WebSearch サービスにリクエストを送信するときに、検索クエリと受信する XML レスポンスの両方のエンコード スキームを指定できます。

ie リクエスト パラメータを使用して、HTTP リクエスト内の文字のエンコード メカニズムを指定できます。また、oe パラメータを使用して、Google が XML レスポンスのエンコードに使用するエンコード スキームを指定することもできます。ISO-8859-1(または latin1)以外のエンコード スキームを使用している場合は、ie パラメータと oe パラメータに正しい値を指定してください。

注: 複数の言語の検索機能を提供する場合は、ie パラメータと oe パラメータの両方に utf8(UTF-8)エンコード値を使用することをおすすめします。

ie パラメータと oe パラメータに使用できる値の一覧については、付録の文字エンコード スキームをご覧ください。

文字エンコードに関する一般的な情報については、http://www.w3.org/TR/REC-html40/charset.html をご覧ください。

インターフェース言語

hl リクエスト パラメータを使用して、グラフィカル インターフェースの言語を指定できます。hl パラメータ値は XML 検索結果に影響する可能性があります。特に、言語の制限(lr パラメータを使用)が明示的に指定されていない国際的なクエリでは特に注意が必要です。このような場合、hl パラメータを使用すると、ユーザーの入力言語と同じ言語で検索結果がプロモートされる場合があります。

Google が各クエリに対して最高品質の検索結果を選択できるように、検索結果に hl パラメータを明示的に設定することをおすすめします。

hl パラメータの有効な値の一覧については、サポートされているインターフェース言語をご覧ください。

特定の言語で記述されたドキュメントの検索

lr リクエスト パラメータを使用すると、検索結果を特定の言語または言語セットで記述されたドキュメントに限定できます。

lr パラメータはブール演算子をサポートしているため、検索結果に含める(または除外する)複数の言語を指定できます。

次の例は、ブール演算子を使用して異なる言語のドキュメントをリクエストする方法を示しています。

日本語で書かれたドキュメントの場合:

lr=lang_jp

イタリア語またはドイツ語で書かれたドキュメントの場合:

lr=lang_it|lang_de

ハンガリー語またはチェコ語以外のドキュメントの場合:

lr=(-lang_hu).(-lang_cs)

lr パラメータに指定できる値の一覧については、言語コレクション値のセクションをご覧ください。これらの演算子の使用方法について詳しくは、ブール演算子のセクションをご覧ください。

簡体字中国語と繁体字中国語は、中国語の 2 つの文字バージョンです。同じコンセプトが各バリアントで異なる場合もあります。いずれかのパターンで検索語句を指定すると、Google ウェブ検索サービスによって、両方のパターンのページを含む結果が返されます。

この機能を使用するには:

  1. c2coff リクエスト パラメータを 0 に設定します。
  2. 次のいずれかを行います。
    • lr リクエスト パラメータを設定しない
      または
    • lr リクエスト パラメータを lr=lang_zh-TW|lang_zh-CN に設定します。

次の例は、簡体字中国語と繁体字中国語の両方の検索結果のリクエストに含めるクエリ パラメータを示しています。(クライアントなどの追加の必須情報はこの例には含まれていません)。

search?hl=zh-CN
    &lr=lang_zh-TW|lang_zh-CN
    &c2coff=0

結果のフィルタリング

Google WS では、さまざまな方法で検索結果をフィルタリングできます。

検索結果の自動フィルタリング

Google では、最適な検索結果を表示するため、次の 2 つの手法を使用して、一般的に望ましくないと見なされる検索結果を自動的にフィルタしています。

  • 重複コンテンツ - 複数のドキュメントに同じ情報が含まれている場合、検索結果には最も関連性の高いドキュメントのみが含まれます。

  • ホストのクラウディング - 同じサイトから多数の検索結果がある場合、そのサイトからのすべての検索結果が表示されない場合や、
    以前より掲載順位が下がることがあります。

一般的な検索リクエストでは、これらのフィルタをオンのままにしておくことをおすすめします。フィルタにより、ほとんどの検索結果の品質が大幅に向上します。ただし、検索リクエストで filter クエリ パラメータを 0 に設定することで、これらの自動フィルタをバイパスできます。

言語と国のフィルタリング

Google WS サービスでは、すべてのウェブ ドキュメントのマスター インデックスから検索結果が返されます。マスター インデックスには、特定の属性(元の言語や国など)でグループ化されたドキュメントのサブコレクションが含まれます。

lrcr のリクエスト パラメータを使用して、特定の言語で書かれたドキュメントのサブコレクション、または特定の国から発信されたドキュメントのサブコレクションのみに検索結果を制限できます。

Google WS はドキュメントの言語を次の方法で分析します。

  • ドキュメントの URL のトップレベル ドメイン(TLD)
  • ドキュメント内の言語メタタグ
  • ドキュメントの本文で使用される主な言語


また、言語に基づいて結果を制限する方法について詳しくは、lr パラメータの定義、特定の言語で書かれたドキュメントの検索のセクション、lr パラメータの値として使用できる言語コレクションの値をご覧ください。

Google WS はドキュメントの国を次の方法で分析します。

  • ドキュメントの URL のトップレベル ドメイン(TLD)
  • ウェブサーバーの IP アドレスの地理的位置

配信元の国による結果の制限について詳しくは、cr パラメータの定義と、cr パラメータの値として使用できる国別コレクション値をご覧ください。

注: 言語の値と国の値を組み合わせて検索結果をカスタマイズできます。たとえば、フランスまたはカナダの、フランス語で記述された書類や、オランダから発行された英語以外の書類をリクエストできます。lr パラメータと cr パラメータは、どちらもブール演算子をサポートしています。

セーフサーチでアダルト コンテンツを除外する

Google ユーザーの多くは、アダルト コンテンツを含むサイトの検索結果を表示することを望んでいません。セーフサーチ フィルタを使用すると、アダルト コンテンツを含む検索結果をスクリーニングし、除外できます。Google のフィルタは、独自の技術を使用してキーワード、フレーズ、URL をチェックします。フィルタは 100% 正確というわけではありませんが、セーフサーチはアダルト コンテンツの大部分を検索結果から除外します。

Google では、ウェブを継続的にクロールし、ユーザーの提案から得たアップデートを組み込むことで、セーフサーチを可能な限り最新で包括的なものにするよう努めています。

セーフサーチは、次の言語でご利用いただけます。

オランダ語
英語
フランス語
ドイツ語
イタリア語
ポルトガル語(ブラジル)
スペイン語
繁体字中国語

safe クエリ パラメータを使用して、アダルト コンテンツの結果を Google がどの程度フィルタするかを調整できます。次の表に、Google のセーフサーチ設定と、それらの設定が検索結果に与える影響を示します。

セーフサーチ レベル 説明
より厳密なバージョンのセーフサーチを有効にします。
medium ポルノなどの露骨な性的コンテンツを含むウェブページをブロックします。
オフ 検索結果からアダルト コンテンツは除外されません。

* セーフサーチのデフォルトの設定はオフです。

セーフサーチを有効にしていて、不適切なコンテンツを含むサイトが検索結果に表示される場合は、そのサイトの URL を safesearch@google.com にメールでお知らせください。Google でサイトを調査します。

XML 結果

Google XML 結果 DTD

Google では、同じ DTD を使用して、すべてのタイプの検索結果に対応する XML 形式を記述します。タグと属性の多くは、すべての検索タイプに適用できます。ただし、一部のタグは特定の検索タイプにのみ適用されます。したがって、DTD での定義は、このドキュメントで定義されている定義よりも制限が緩やかになる可能性があります。

このドキュメントでは、ウェブ検索に関連する DTD の側面について説明します。WebSearch で作業している場合は、DTD を確認する際に、ここに記載されていないタグや属性は無視してかまいません。DTD とドキュメントで定義が異なる場合は、このドキュメントにその旨を記載しています。

Google は、最新の DTD への参照の有無にかかわらず、XML の結果を返すことができます。DTD は、検索管理者と XML パーサーが Google の XML 結果を理解できるようにするためのガイドです。Google の XML 文法は随時変更される可能性があるため、DTD を使用して各 XML の結果を検証するようにパーサーを構成する必要はありません。

また、検索リクエストを送信するたびに DTD を取得するように XML パーサーを構成しないでください。Google が DTD を更新する頻度は低いため、このようなリクエストによって不必要な遅延と帯域幅の要件が生じます。

Google では、出力形式 xml_no_dtd を使用して XML の結果を取得することをおすすめします。 検索リクエストで xml 出力形式を指定した場合、XML の結果に次の行が表示される点だけが異なります。

<!DOCTYPE GSP SYSTEM "google.dtd">

最新の DTD には、http://www.google.com/google.dtd からアクセスできます。

現時点では、DTD のすべての機能が利用可能またはサポートされているわけではないことにご注意ください。

XML レスポンスについて

  • XML タグの定義で特に断りのない限り、すべての要素の値は、表示に適した有効な HTML です。
  • 一部の要素値には、表示前に HTML エンコードが必要な URL があります。
  • XML パーサーでは、ドキュメント化されていない属性やタグは無視されます。これにより、Google が XML 出力にさらに機能を追加しても、アプリをそのまま動作させることができます。
  • 特定の文字を XML タグに含める場合は、エスケープする必要があります。XML プロセッサはこれらのエンティティを適切な文字に変換する必要があります。エンティティを適切に変換しないと、たとえばブラウザによって & 文字が「&amp;」として表示されることがあります。これらの文字は XML 規格に記載されています。以下の表に再現しています。

    文字 エスケープされたフォーム エンティティ 文字コード
    アンパサンド & &amp; &#38;
    一重引用符 ' &apos; &#39;
    二重引用符 &quot; &#34;
    不等記号(より大) > &gt; &#62;
    不等記号(より小) < &lt; &#60;

通常の検索クエリと高度な検索クエリの XML 結果

通常検索/詳細検索: サンプルクエリと XML の結果

このサンプル WebSearch リクエストは、検索キーワード「socer」(q=socer)について 10 件の検索結果(num=10)を要求しています。これは、この例では「サッカー」という単語を意図的に間違って記述しています。)

http://www.google.com/search?
q=socer
&hl=en
&start=10
&num=10
&output=xml
&client=google-csbe
&cx=00255077836266642015:u-scht7a-8i

このリクエストでは、次のような XML の結果が返されます。XML の結果には、結果に含まれない特定のタグがどこに表示されるかを示すコメントがいくつかあることに注意してください。

<?xml version="1.0" encoding="ISO-8859-1" standalone="no" ?>

<GSP VER="3.2">
<TM>0.452923</TM>
<Q>socer</Q>
<PARAM name="cx" value="00255077836266642015:u-scht7a-8i" original_value="00255077836266642015%3Au-scht7a-8i"/>
<PARAM name="hl" value="en" original_value="en"/>
<PARAM name="q" value="socer" original_value="socer"/>
<PARAM name="output" value="xml" original_value="xml"/>
<PARAM name="client" value="google-csbe" original_value="google-csbe"/>
<PARAM name="num" value="10" original_value="10"/>
<Spelling>
<Suggestion q="soccer"><b><i>soccer</i></b></Suggestion>
</Spelling>
<Context>
<title>Sample Vacation CSE</title>
<Facet>
<FacetItem>
<label>restaurants</label>
<anchor_text>restaurants</anchor_text>
</FacetItem>
<FacetItem>
<label>wineries</label>
<anchor_text>wineries</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>golf_courses</label>
<anchor_text>golf courses</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>hotels</label>
<anchor_text>hotels</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>nightlife</label>
<anchor_text>nightlife</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>soccer_sites</label>
<anchor_text>soccer sites</anchor_text>
</FacetItem>
</Facet>
</Context>
<RES SN="1" EN="10">
<M>6080</M>
/*
* The FI tag after the comment indicates that the result
* set has been filtered. If the number of results were exact, the
* FI tag would be replaced by an XT tag in the same format.
*/
<FI />
<NB>
/*
* Since the request is for the first page of results, the PU tag,
* which contains a link to the previous page of search results,
* is not included in this XML result. If the sample result did include
* a previous page of results, it would be listed here, in the same format
* as the NU tag on the following line
*/
<NU>/search?q=socer&hl=en&lr=&ie=UTF-8&output=xml&client=test&start=10&sa=N</NU>
</NB>
<R N="1">
<U>http://www.soccerconnection.net/</U>
<UE>http://www.soccerconnection.net/</UE>
<T>SoccerConnection.net</T>
<CRAWLDATE>May 21, 2007</CRAWLDATE>
<S><b>soccer</b>; players; coaches; ball; world cup;<b>...</b></S>
<Label>transcodable_pages</Label>
<Label>accessible</Label>
<Label>soccer_sites</Label>
<LANG>en</LANG>
<HAS>
<DI>
<DT>SoccerConnection.net</DT>
<DS>Post your <b>soccer</b> resume directly on the Internet.</DS>
</DI>
<L/>
<C SZ="8k" CID="kWAPoYw1xIUJ"/>
<RT/>
</HAS>
</R>
/*
* The result includes nine more results, each enclosed by an R tag.
*/
</RES>
</GSP>

通常検索/詳細検索: XML タグ

通常の検索リクエストと検索オプション リクエストの XML レスポンスでは、どちらも同じ XML タグセットを使用します。これらの XML タグは、上記の XML の例と以下の表で説明しています。

以下の XML タグは、タグ名のアルファベット順に記載しています。各タグ定義には、タグの説明、XML 結果でのタグの表示例、タグのコンテンツの形式などが含まれています。タグが別の XML タグのサブタグである場合や、タグに独自のサブタグまたは属性がある場合、その情報はタグの定義表にも記載されます。

以下の定義では、特定の記号がサブタグの横に表示される場合があります。表示される記号とその意味は次のとおりです。

? = 省略可能なサブタグ
* = 0 個以上のサブタグのインスタンス
+ = 1 個以上のサブタグのインスタンス
A B C D F G H I L M N P Q R S T U X

anchor_text
定義

<anchor_text> タグは、検索結果セットに関連付けられた絞り込みラベルを識別するためにユーザーに表示するテキストを指定します。絞り込みラベルでは英数字以外の文字がアンダースコアに置き換えられるため、ユーザー インターフェースに <label> タグの値を表示しないでください。代わりに、<anchor_text> タグの値を表示してください。

<anchor_text>ゴルフ コース</anchor_text>
次のサブタグ: FacetItem
コンテンツの形式 テキスト

BLOCK
定義

このタグは、プロモーション結果の本文に含まれるブロックの内容をカプセル化します。各ブロックにはサブタグ TUL があります。空でない T タグは、ブロックにテキストが含まれていることを表します。空でない U タグと L タグは、ブロックにリンクが含まれていることを示します(URL は U サブタグで指定され、アンカー テキストは L サブタグで指定されます)。

サブタグ TUL
次のサブタグ: BODY_LINE
コンテンツの形式 空白

BODY_LINE
定義

このタグは、昇格された結果の本文に行の内容をカプセル化します。各本文は、いくつかの BLOCK タグで構成され、テキストか、URL とアンカー テキスト付きのリンクのいずれかが含まれます。

サブタグ ブロック*
次のサブタグ: SL_MAIN
コンテンツの形式 空白

C
定義

<C> タグは、ウェブ検索サービスがこの検索結果 URL のキャッシュ バージョンを取得できることを示します。XML API でキャッシュされたページを取得することはできませんが、このコンテンツのユーザーを www.google.com にリダイレクトすることはできます。

Attributes
名前 形式 説明
SZ テキスト(整数 + "k") 検索結果のキャッシュ バージョンのサイズを KB(k)単位で提供します。
CID テキスト Google のキャッシュ内のドキュメントを識別します。キャッシュからドキュメントを取得するには、次のように構築された検索キーワードを送信します。
cache:CIDtext:escapedURL

エスケープされた URL は UE タグで確認できます。

<C SZ="6k" CID="kvOXK_cYSSgJ" />
次のサブタグ: HAS
コンテンツの形式 空白

C2C
定義 <C2C> タグは、検索結果が繁体字中国語のページを参照していることを示します。このタグは、簡体字中国語と繁体字中国語の検索が有効になっている場合にのみ表示されます。この機能の有効化と無効化の詳細については、c2coff クエリ パラメータの定義をご覧ください。
コンテンツの形式 テキスト

コンテキスト
定義

<Context> タグは、検索結果のセットに関連付けられた絞り込みラベルのリストをカプセル化します。

<Context>
サブタグ titleFacet+
コンテンツの形式 コンテナ

クロール日
定義

<CRAWLDATE> タグは、ページが最後にクロールされた日付を示します。すべての検索結果ページで CRAWLDATE が返されるわけではありません。

<CRAWLDATE>2005 年 5 月 21 日</CRAWLDATE>
次のサブタグ: R
コンテンツの形式 テキスト

DI
定義

<DI> タグは、1 件の検索結果について Open Directory Project(ODP)のカテゴリ情報をカプセル化するタグです。

<DI>
サブタグ DT?、DS を使用しているかどうか。
次のサブタグ: HAS
コンテンツの形式 空白

DS
定義

<DS> タグは、ODP ディレクトリ内の 1 つのカテゴリについてリストされるサマリーを提供します。

<DS>「<b>サッカー</b>」の履歴書をインターネットに直接投稿できます。</DS>
次のサブタグ: DI
コンテンツの形式 テキスト(HTML を含む可能性がある)

DT
定義

<DT> タグは、ODP ディレクトリにリストされる 1 つのカテゴリのタイトルを指定します。

<DT>SoccerConnection.net</DT>
次のサブタグ: DI
コンテンツの形式 テキスト(HTML を含む可能性がある)

ファセット
定義

<Facet> タグは、<FacetItem> タグの論理グループを含みます。これらのグループは、プログラム可能検索エンジンの XML 仕様形式を使用して作成できます。これらのグループを作成しない場合、results_xml_tag_Context><Context> タグには最大 4 つの <Facet> タグが含まれます。各 <Facet> タグ内の項目は表示のためにグループ化されますが、論理関係を持たない場合があります。

<Facet>
サブタグ FacetItem+、title+
次のサブタグ: コンテキスト
コンテンツの形式 コンテナ

FacetItem
定義

<FacetItem> タグは、検索結果のセットに関連付けられた絞り込みラベルに関する情報をカプセル化します。

<FacetItem>
サブタグ label, anchor_text+
次のサブタグ: Facet
コンテンツの形式 FacetItem

フィンランド
定義 <FI> タグは、検索でドキュメント フィルタリングが実行されたかどうかを示すフラグとして機能します。Google の検索結果フィルタの詳細については、このドキュメントの自動フィルタリングのセクションをご覧ください。
<FI />
次のサブタグ: RES
コンテンツの形式 空白

GSP
定義

<GSP> タグは、Google の XML 検索結果で返されるすべてのデータをカプセル化します。「GSP」は「Google 検索プロトコル」の略です。

Attributes
名前 形式 説明
VER テキスト(整数) VER 属性は、検索結果の出力のバージョンを指定します。現在の出力バージョンは「3.2」です。
<GSP VER="3.2">
サブタグ PARAM+、QRES?、商標
コンテンツの形式 空白

HAS
定義 <HAS> タグは、特定の URL でサポートされている特別な検索リクエスト パラメータに関する情報をカプセル化します。

注: WebSearch における <HAS> の定義は、DTD における定義よりも厳しくなっています。

サブタグ DI?、L?、C?、RT
次のサブタグ: R

ISURL
定義 関連付けられた検索クエリが URL の場合、Google は <ISURL> タグを返します。
次のサブタグ: Google サービス
コンテンツの形式 空白

L
定義 <L> タグが存在する場合、ウェブ検索サービスが、この検索結果 URL にリンクしている他のサイトを検出できることを示します。このようなサイトを検索するには、特別なクエリ用語 link: を使用します。
次のサブタグ: HAS
コンテンツの形式 空白

label
定義

<label> タグは、受信した検索結果のフィルタリングに使用できる絞り込みラベルを指定します。絞り込みラベルを使用するには、次の例のように、Google への HTTP リクエストの q パラメータの値に文字列 more:[[label tag value]] を追加します。この値は、Google にクエリを送信する前に、URL エスケープする必要があります。

This example uses the refinement label golf_courses to
filter search results about Palm Springs:
q=Palm+Springs+more:golf_courses

The URL-escaped version of this query is:
q=Palm+Springs+more%3Agolf_courses

注: <label> タグは、検索結果の特定の URL に関連付けられた絞り込みラベルを識別する <Label> タグとは異なります。

<label>golf_courses</label>
次のサブタグ: FacetItem
コンテンツの形式 テキスト

LANG
定義

<LANG> タグには、Google が検索結果の言語として最も推測した言語の情報が含まれます。

<LANG>en</LANG>
次のサブタグ: R
コンテンツの形式 テキスト

M
定義

<M> タグは、検索結果の推定総数を示します。

注: この推定値は正確でない可能性があります。

<M>16200000</M>
次のサブタグ: RES
コンテンツの形式 テキスト

新生児
定義

<NB> タグは、結果セットのナビゲーション情報(検索結果の次のページまたは前の検索結果ページへのリンク)をカプセル化します。

注: このタグは、利用可能な検索結果がこれより多い場合にのみ指定します。

<NB>
サブタグ NU?, PU
次のサブタグ: RES
コンテンツの形式 空白

NU
定義

<NU> タグには、検索結果の次のページへの相対リンクが含まれます。

<NU>/search?q=flowers&num=10&hl=ja&ie=UTF-8
&output=xml&client=test&start=10</NU>
次のサブタグ:
コンテンツの形式 テキスト(相対 URL)

PARAM
定義

<PARAM> タグは、XML の結果に関連付けられた HTTP リクエストで送信された入力パラメータを識別します。パラメータに関する情報はタグ属性(name、value、original_value)に含まれ、HTTP リクエストで送信されるパラメータごとに 1 つの PARAM タグがあります。

Attributes
名前 形式 説明
name テキスト 入力パラメータ名。
value HTML 入力パラメータ値の HTML 形式バージョン。
original_value テキスト 入力パラメータ値の元の URL エスケープ バージョン。
<PARAM name="cr" value="countryNZ" original_value="countryNZ" />
次のサブタグ: Google サービス
コンテンツの形式 複雑さ

PU
定義

<PU> タグは、検索結果の前のページへの相対リンクを示します。

<PU>/search?q=flowers&num=10&hl=ja&output=xml
&client=test&start=10</PU>
次のサブタグ:
コンテンツの形式 テキスト(相対 URL)

Q
定義

<Q> タグは、XML の結果に関連付けられた HTTP リクエストで送信された検索クエリを識別します。

<Q>pizza</Q>

次のサブタグ: Google サービス
コンテンツの形式 テキスト

R
定義

<R> タグは、個々の検索結果の詳細をカプセル化します。

注: WebSearch の <R> タグの定義は、DTD より厳しくなっています。

Attributes
名前 形式 説明
N テキスト(整数) この検索結果のインデックス(1 から始まる)を示します。
MIME テキスト 検索結果の MIME タイプを示します。
サブタグ UUET?、CRAWLDATES?、LANG?、HAS
次のサブタグ: RES

RES
定義

<RES> タグでは、個々の検索結果のセットと結果の詳細をカプセル化します。

Attributes
名前 形式 説明
SN テキスト(整数) この結果セットで最初に返された検索結果のインデックス(1 から始まる)を示します。
EN テキスト(整数) この結果セットで返された最後の検索結果のインデックス(1 ベース)を示します。
<RES SN="1" EN="10">
サブタグ MFI?、XT?、:,R*
次のサブタグ: Google サービス
コンテンツの形式 空白

S
定義

<S> タグには、太字でハイライト表示されたクエリ語句を示す検索結果の抜粋が含まれます。テキストが適切に折り返されるように、抜粋には改行を入れています。

<S>ワシントン(CNN)- <b>...<b>...<b>S
次のサブタグ: R
コンテンツの形式 テキスト(HTML)

SL_MAIN
定義

このタグは、プロモーションの結果のコンテンツをカプセル化します。プロモーションの解析に使用します。タイトルリンクのアンカー テキストと URL は、それぞれ T サブタグと U サブタグに含まれます。本文のテキスト行とリンクは、BODY_LINE サブタグに含まれます。

サブタグ BODY_LINE*、TU
次のサブタグ: SL_RESULTS
コンテンツの形式 空白

SL_RESULTS
定義

プロモートされた結果のコンテナタグ。検索結果にプロモーションが表示されるたびに、このいずれかが表示されます。SL_MAIN サブタグには、主な結果データが含まれます。

サブタグ SL_MAIN*
次のサブタグ: R
コンテンツの形式 空白

スペル
定義

<Spelling> タグは、送信されたクエリの別のスペル候補をカプセル化します。このタグは検索結果の最初のページにのみ表示されます。スペルの候補は、英語、中国語、日本語、韓国語に対応しています。

注: gl パラメータの値が小文字であるクエリに対してのみ、スペルの候補が返されます。

<Spelling>
サブタグ 候補
次のサブタグ: Google サービス
コンテンツの形式 空白

アドバイス
定義 <Suggestion> タグは、送信されたクエリに対する別のスペル候補を示します。タグのコンテンツを使用して、検索ユーザーに別のスペルを提案できます。q 属性の値は、クエリ語句として使用できる URL エスケープされたスペル候補です。
Attributes
名前 形式 Description
q テキスト q 属性は、スペル候補の URL エスケープ バージョンを指定します。
<Suggestion q="サッカー">&lt;b&gt;&lt;i&gt;サッカー&lt;/i&gt;&lt;/b&gt;</Suggestion>
次のサブタグ: つづり
コンテンツの形式 テキスト(HTML)

T
定義 <T> タグには結果のタイトルが含まれます。
<T>Amici's East Coast Pizzeria</T>
次のサブタグ: R
コンテンツの形式 テキスト(HTML)

title
定義

<Context> の子タグである <title> タグには、プログラム可能検索エンジンの名前が含まれます。

<Facet> の子として、<title> タグは一連のファセットのタイトルを指定します。

<Context> の子として: <title>My Search Engine</title>

<Facet> の子として: <title>facet title</title>

次のサブタグ: ContextFacet
コンテンツの形式 テキスト

TM
定義

<TM> タグは、検索結果を返すのに必要なサーバー時間の合計を秒単位で示します。

<TM>0.100445</TM>
次のサブタグ: Google サービス
コンテンツの形式 テキスト(浮動小数点数)

TikTok
定義 <TT> タグは検索のヒントを提供します。
<TT>&lt;i&gt;ヒント: ほとんどのブラウザでは、Return キーを押すと [検索] ボタンをクリックしたのと同じ結果が得られます。<TT>
次のサブタグ: Google サービス

U
定義 <U> タグは検索結果の URL を示します。
<U>http://www.dominos.com/</U>
次のサブタグ: R
コンテンツの形式 テキスト(絶対 URL)

ウズベキスタン
定義

<UD> タグは、検索結果の IDN エンコード(国際ドメイン名)URL を提供します。この値を指定すると、ローカル言語でドメインを表示できます。たとえば、IDN でエンコードされた URL「http://www.%E8%8A%B1%E4%BA%95.com」をデコードして、http://www.花井広告費用対効果.com として表示できます。この <UD> タグは、ud パラメータを含むリクエストの検索結果にのみ含まれます。

注: これはベータ版の機能です。

<UD>http://www.%E8%8A%B1%E4%BA%95.com/</UD>
次のサブタグ: R
コンテンツの形式 テキスト(IDN エンコードされた URL)

UE
定義 <UE> タグは検索結果の URL を提供します。値は URL エスケープされているため、URL 内のクエリ パラメータとして渡すのに適しています。
<UE>http://www.dominos.com/</UE>
次のサブタグ: R
コンテンツの形式 テキスト(URL エスケープされた URL)

XT
定義 <XT> タグは、M タグで指定された結果の推定総数が、実際に結果の正確な総数を表していることを示します。詳細については、このドキュメントの自動フィルタリングをご覧ください。
<XT />
次のサブタグ: RES
コンテンツの形式 空白


画像検索クエリの XML 結果

このサンプル画像リクエストは、検索キーワード「monkey」(q=monkey)について 5 件の結果(num=5)を要求しています。

http://www.google.com/cse?
  searchtype=image
  &num=2
  &q=monkey
  &client=google-csbe
  &output=xml_no_dtd
  &cx=00255077836266642015:u-scht7a-8i

このリクエストでは、次のような XML の結果が返されます。


<GSP VER="3.2">
  <TM>0.395037</TM>
  <Q>monkeys</Q>

  <PARAM name="cx" value="011737558837375720776:mbfrjmyam1g" original_value="011737558837375720776:mbfrjmyam1g" url_<escaped_value="011737558837375720776%3Ambfrjmyam1g" js_escaped_value="011737558837375720776:mbfrjmyam1g"/>
  <PARAM name="client" value="google-csbe" original_value="google-csbe" url_escaped_value="google-csbe" js_escaped_value="google-csbe"/>
  <PARAM name="q" value="monkeys" original_value="monkeys" url_escaped_value="monkeys" js_escaped_value="monkeys"/>
  <PARAM name="num" value="2" original_value="2" url_escaped_value="2" js_escaped_value="2"/>
  <PARAM name="output" value="xml_no_dtd" original_value="xml_no_dtd" url_escaped_value="xml_no_dtd" js_escaped_value="xml_no_dtd"/>
  <PARAM name="adkw" value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" original_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" url_escaped_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" js_escaped_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A"/>
  <PARAM name="hl" value="en" original_value="en" url_escaped_value="en" js_escaped_value="en"/>
  <PARAM name="oe" value="UTF-8" original_value="UTF-8" url_escaped_value="UTF-8" js_escaped_value="UTF-8"/>
  <PARAM name="ie" value="UTF-8" original_value="UTF-8" url_escaped_value="UTF-8" js_escaped_value="UTF-8"/>
  <PARAM name="boostcse" value="0" original_value="0" url_escaped_value="0" js_escaped_value="0"/>

  <Context>
    <title>domestigeek</title>
  </Context>

  <ARES/>
  <RES SN="1" EN="2">
    <M>2500000</M>
    <NB>
      <NU>/images?q=monkeys&num=2&hl=en&client=google-csbe&cx=011737558837375720776:mbfrjmyam1g&boostcse=0&output=xml_no_dtd
        &ie=UTF-8&oe=UTF-8&tbm=isch&ei=786oTsLiJaaFiALKrPChBg&start=2&sa=N
      </NU>
    </NB>
    <RG START="1" SIZE="2"/>
      <R N="1" MIME="image/jpeg">
        <RU>http://www.flickr.com/photos/fncll/135465558/</RU>
        <U>
          http://farm1.static.flickr.com/46/135465558_123402af8c.jpg
        </U>
        <UE>
          http://farm1.static.flickr.com/46/135465558_123402af8c.jpg
        </UE>
        <T>Computer <b>Monkeys</b> | Flickr - Photo Sharing!</T>
        <RK>0</RK>
        <BYLINEDATE>1146034800</BYLINEDATE>
        <S>Computer <b>Monkeys</b> | Flickr</S>
        <LANG>en</LANG>
        <IMG WH="500" HT="305" IID="ANd9GcQARKLwzi-t4lpWi2AERV3kJb4ansaQzTn3MNDZR9fD_JDiktPKByKUBLs">
          <SZ>88386</SZ>
          <IN/>
        </IMG>
        <TBN TYPE="0" WH="130" HT="79" URL="http://t0.gstatic.com/images?q=tbn:ANd9GcQARKLwzi-
t4lpWi2AERV3kJb4ansaQzTn3MNDZR9fD_JDiktPKByKUBLs"/>
      </R>
      <R N="2" MIME="image/jpeg">
        <RU>
          http://www.flickr.com/photos/flickerbulb/187044366/
        </RU>
        <U>
          http://farm1.static.flickr.com/73/187044366_506a1933f4.jpg
        </U>
        <UE>
          http://farm1.static.flickr.com/73/187044366_506a1933f4.jpg
        </UE>
        <T>
          one. ugly. <b>monkey</b>. | Flickr - Photo Sharing!
        </T>
        <RK>0</RK>
        <BYLINEDATE>1152514800</BYLINEDATE>
        <S>one. ugly. <b>monkey</b>.</S>
        <LANG>en</LANG>
        <IMG WH="400" HT="481" IID="ANd9GcQ3Qom0bYbee4fThCQVi96jMEwMU6IvVf2b8K5vERKVw-
           EF4tQQnDDKOq0"><SZ>58339</SZ>
          <IN/>
        </IMG>
        <TBN TYPE="0" WH="107" HT="129" URL="http://t1.gstatic.com/images?q=tbn:ANd9GcQ3Qom0bYbee4fThCQ
          Vi96jMEwMU6IvVf2b8K5vERKVw-EF4tQQnDDKOq0"/>
      </R>
  </RES>
</GSP>

画像検索: XML タグ

次の表に、画像検索クエリの XML レスポンスで使用される追加の XML タグを示します。

以下の定義では、特定の記号がサブタグの横に表示される場合があります。表示される記号とその意味は次のとおりです。

? = 省略可能なサブタグ
* = 0 個以上のサブタグのインスタンス
+ = 1 個以上のサブタグのインスタンス

確定
定義

<RG> タグには、個々の画像検索結果の詳細が含まれます。

Attributes
名前 形式 説明
N テキスト(整数) この検索結果のインデックス(1 から始まる)を示します。
MIME テキスト 検索結果の MIME タイプを示します。
次のサブタグ: RES
RU
定義

<RU タグ> タグには、各画像検索結果の詳細が含まれます。

次のサブタグ: R