Google Cloud Search には、検索結果に影響するデフォルトの拡張、解釈、最適化がいくつかあります。予期しない検索結果が表示された場合は、Cloud Search サポートにお問い合わせいただく前に、こちらのガイドをご覧ください。
このドキュメントでは、ユーザーのクエリは角かっこ([query])で囲み、
システムの解釈は引用符("interpretation")で囲んで示しています。
このドキュメントのクエリ結果は、動作の例を示すものであり、拡張、解釈、最適化の仕組みを理解するのに役立ちます。実際の検索結果は異なる場合があります。
デフォルトの拡張
ユーザーが [Joe’s PDFs] を検索したときに、一部の検索結果に
ハイライト表示される単語が "PDFs" ではなく "documents" になることがあります。これは、Google 検索と同様に、Cloud Search
がクエリを拡張して同義語や語幹を含めるためです。この拡張により、クエリのアイデアや意図に一致するドキュメントを取得できます。ランキング
アルゴリズムにより、最適な一致が上位に表示されます。
ユーザーが [Joe’s PDFs] を検索すると、Cloud Search は次の単語を追加する場合があります。
[Joe’s]の場合、"joe"(語幹の拡張)と"joes"(句読記号に基づく同義語)が一致する可能性があります。[PDFs]の場合、"documents"(同義語の拡張)と"pdf"(語幹の拡張)が一致する可能性があります。
デフォルトの同義語は必ずしも双方向ではありません。たとえば、
[phishing] の検索では "phish" が一致する可能性がありますが、[phish] の検索では
"phishing" が一致しない可能性があります。
ハイフンとアンダースコアを含む単語の拡張
Cloud Search は、[walk-in closet] と [walk in closet]
のように、ハイフンを含む単語とそのハイフンを含まない単語を区別します。
また、[walk-in] と [walk_in]
のように、ハイフンとアンダースコアを含む単語には異なる最適化が適用されます。
デフォルトの拡張を補正する
Cloud Search は特定の拡張を保証しません。双方向の同義語やドメイン固有の拡張を確実に行うには、独自の同義語を作成します。詳細については、同義語 を定義するをご覧ください。
デフォルトの解釈
Cloud Search は、データソース スキーマに基づいて自然言語の解釈を行います。詳細については、最適なクエリ解釈のための スキーマを構造するをご覧ください。
自然言語の解釈を無効にする
特定のクエリの自然言語の解釈を無効にするには、検索リクエストで
QueryInterpretationOptions.disableNlInterpretation
を true に設定します。
デフォルトの最適化
Cloud Search には、次のデフォルトの最適化が用意されています。
スペル修正のブレンド: クエリ
[corpoate benefits]の場合、 Cloud Search は"corpoate"と正しいスペルの"corporate"を照合します。補足結果: 結果がほとんどないクエリの場合、Cloud Search は関連用語の許容範囲の広いセットを使用します。詳細については、補足結果を処理するをご覧ください。
ドキュメントとクエリを正規化する
正規化とは、クエリの前後に単語やフレーズを標準化することです。レスポンスの一貫性を確保するには、次の正規化手順を検討してください。
ドキュメントを正規化するには:
- リポジトリ内の重要な単語の正規のスペルを選択します。
- ソース ドキュメントまたはインデックス登録時にスペルを修正して、正規の形式に合わせます。
クエリを正規化するには:
- ユーザーのクエリを Cloud Search に送信する前にインターセプトします。
- インデックス登録されたデータソースで最も一般的なスペルに一致するように、クエリ内の単語を書き換えます。
- 書き換えられたクエリを Cloud Search に送信します。
拡張、解釈、最適化を無効にする
特定のクエリでこれらの機能を無効にするには、検索リクエストで
QueryInterpretationOptions.enableVerbatimMode
を true に設定します。