デフォルトの展開、解釈、最適化を補正する

Google Cloud Search には、検索結果に影響するデフォルトの拡張、解釈、最適化がいくつかあります。予期しない検索結果が表示された場合は、Cloud Search サポートにお問い合わせいただく前に、こちらのガイドをご覧ください。

このドキュメントでは、ユーザーのクエリは角かっこ([query])で囲み、 システムの解釈は引用符("interpretation")で囲んで示しています。

このドキュメントのクエリ結果は、動作の例を示すものであり、拡張、解釈、最適化の仕組みを理解するのに役立ちます。実際の検索結果は異なる場合があります。

デフォルトの拡張

ユーザーが [Joe’s PDFs] を検索したときに、一部の検索結果に ハイライト表示される単語が "PDFs" ではなく "documents" になることがあります。これは、Google 検索と同様に、Cloud Search がクエリを拡張して同義語や語幹を含めるためです。この拡張により、クエリのアイデアや意図に一致するドキュメントを取得できます。ランキング アルゴリズムにより、最適な一致が上位に表示されます。

ユーザーが [Joe’s PDFs] を検索すると、Cloud Search は次の単語を追加する場合があります。

  • [Joe’s] の場合、"joe"(語幹の拡張)と "joes" (句読記号に基づく同義語)が一致する可能性があります。
  • [PDFs] の場合、"documents"(同義語の拡張)と "pdf" (語幹の拡張)が一致する可能性があります。

デフォルトの同義語は必ずしも双方向ではありません。たとえば、 [phishing] の検索では "phish" が一致する可能性がありますが、[phish] の検索では "phishing" が一致しない可能性があります。

ハイフンとアンダースコアを含む単語の拡張

Cloud Search は、[walk-in closet][walk in closet] のように、ハイフンを含む単語とそのハイフンを含まない単語を区別します。 また、[walk-in][walk_in] のように、ハイフンとアンダースコアを含む単語には異なる最適化が適用されます。

デフォルトの拡張を補正する

Cloud Search は特定の拡張を保証しません。双方向の同義語やドメイン固有の拡張を確実に行うには、独自の同義語を作成します。詳細については、同義語 を定義するをご覧ください。

デフォルトの解釈

Cloud Search は、データソース スキーマに基づいて自然言語の解釈を行います。詳細については、最適なクエリ解釈のための スキーマを構造するをご覧ください。

自然言語の解釈を無効にする

特定のクエリの自然言語の解釈を無効にするには、検索リクエストで QueryInterpretationOptions.disableNlInterpretationtrue に設定します。

デフォルトの最適化

Cloud Search には、次のデフォルトの最適化が用意されています。

  • スペル修正のブレンド: クエリ [corpoate benefits] の場合、 Cloud Search は "corpoate" と正しいスペルの "corporate" を照合します。

  • 補足結果: 結果がほとんどないクエリの場合、Cloud Search は関連用語の許容範囲の広いセットを使用します。詳細については、補足結果を処理するをご覧ください。

ドキュメントとクエリを正規化する

正規化とは、クエリの前後に単語やフレーズを標準化することです。レスポンスの一貫性を確保するには、次の正規化手順を検討してください。

  • ドキュメントを正規化するには:

    1. リポジトリ内の重要な単語の正規のスペルを選択します。
    2. ソース ドキュメントまたはインデックス登録時にスペルを修正して、正規の形式に合わせます。
  • クエリを正規化するには:

    1. ユーザーのクエリを Cloud Search に送信する前にインターセプトします。
    2. インデックス登録されたデータソースで最も一般的なスペルに一致するように、クエリ内の単語を書き換えます。
    3. 書き換えられたクエリを Cloud Search に送信します。

拡張、解釈、最適化を無効にする

特定のクエリでこれらの機能を無効にするには、検索リクエストで QueryInterpretationOptions.enableVerbatimModetrue に設定します。