Google がページをインデックスに登録する際、各ページの主要コンテンツ(センターピース)が決定されます。同一のように見えるか、メイン コンテンツが非常に似通っている複数のページを Google が見つけた場合、インデックス登録プロセスで収集された要素(シグナル)に基づいて、検索ユーザーにとって最も完成度が高く有用であると客観的に判断されるページを選択し、そのページを正規としてマークします。正規ページは最も高い頻度で定期的にクロールされます。重複ページについては、Google がサイトをクロールする負荷を軽減するため、正規ページより低い頻度でクロールされます。
正規化で重要となる要素は多くありません。HTTP と HTTPS のどちらでページが提供されているか、リダイレクト、サイトマップ内での URL の有無、rel="canonical"link アノテーションです。これらの手法を使って Google に希望を伝えることはできますが、さまざまな理由から Google が別のページを正規として選択する場合もあります。つまり、正規化の希望を伝えることはできますが、確実ではありません。
Google は正規ページをコンテンツと品質を評価するメインのソースとして使用します。Google 検索の検索結果では、通常は正規ページが表示されます。ただし、重複ページの中に明らかに検索ユーザーのニーズにより適しているものがある場合は別です。たとえば、ユーザーがモバイル デバイスで検索した場合は、パソコン用ページが正規とされていても、モバイルページが検索結果に表示される可能性が高くなります。
[[["わかりやすい","easyToUnderstand","thumb-up"],["問題の解決に役立った","solvedMyProblem","thumb-up"],["その他","otherUp","thumb-up"]],[["必要な情報がない","missingTheInformationINeed","thumb-down"],["複雑すぎる / 手順が多すぎる","tooComplicatedTooManySteps","thumb-down"],["最新ではない","outOfDate","thumb-down"],["翻訳に関する問題","translationIssue","thumb-down"],["サンプル / コードに問題がある","samplesCodeIssue","thumb-down"],["その他","otherDown","thumb-down"]],["最終更新日 2025-02-18 UTC。"],[[["Canonicalization is the process of choosing the best URL from a set of duplicate pages on a website."],["Google uses signals like HTTPS, sitemaps, and redirects to determine the canonical URL, aiming to show users the most relevant and complete version of a page."],["While website owners can suggest a preferred canonical URL, Google's algorithms may ultimately select a different URL based on various factors."],["Duplicate content arising from regional or device variations is common and not inherently problematic, but managing it can improve user experience and search performance."],["Google primarily uses the canonical version for content evaluation and search results, but may prioritize other versions (e.g., mobile) based on user context."]]],["Canonicalization is the process of selecting a representative URL for duplicate content. Google chooses the most complete and useful page as the canonical URL, indexing it more regularly. Duplicate pages may arise from region, device, protocol variants, site functions, or accidents. Factors like HTTP/HTTPS, redirects, sitemaps, and `rel=\"canonical\"` annotations influence Google's choice, though it can differ from site preferences. The canonical page is the primary source for content evaluation unless a duplicate better serves a user's specific context.\n"]]