Google 搜索排名系统指南

Google 使用自动化排名系统,这些系统会查看有关 Google 搜索索引中的数千亿网页和其他内容的许多因素和信号,以提供最相关、最有用的结果,所有这些操作都能在几秒内完成。

我们会定期通过严格的测试和评估来改进这些系统,并在排名系统更新时发出通知(如果这些更新可能会对内容创作者等有所帮助)。

本页将介绍我们的一些更加知名的排名系统。其中介绍了我们的核心排名系统中的一些系统,这些系统是针对查询生成搜索结果的底层技术。此外,还介绍了涉及特定排名需求的一些系统。

您还可以访问我们的 Google 搜索的工作方式网站,了解我们的排名系统如何与其他流程协同运作,让 Google 搜索能够实现我们的使命,即整合全球信息供大众使用,使人人受益。

BERT

Bidirectional Encoder Representations from Transformers (BERT) 是 Google 使用的 AI 系统,可让我们了解字词的不同组合如何表达出不同的含义和意图。

灾难信息系统

Google 开发了多个系统,以便在发生灾难时(无论是个人危机情况、自然灾害还是其他大范围扩散的灾难情况)提供及时且实用的信息:

  • 个人危机:我们的系统会努力了解人们何时在寻求个人危机方面的信息,并在有关自杀、性侵、中毒、性别暴力或毒瘾等的特定查询时显示热线和受信任组织的内容。详细了解个人危机信息在 Google 搜索中的显示方式
  • SOS 警报:在自然灾害或大范围的灾害发生期间,我们的 SOS 警报系统会尝试显示当地、全国或国际机构发布的资讯。这些资讯可能包括紧急电话号码和网站、地图、有用短语的翻译、捐赠机会等。详细了解 SOS 警报的工作原理以及它们如何纳入了 Google 的灾害警报系统,以帮助应对洪水、野火、地震、飓风和其他灾难。

重复信息删除系统

在 Google 上搜索时,您可能会看到数千个甚至数百万个匹配的网页。其中某些参数可能彼此非常相似。在这种情况下,我们的系统会仅显示最相关的结果,以避免无益的重复信息。详细了解删除重复信息的工作方式以及在重复信息被删除时如何根据需要查看省略的结果

我们在删除重复信息时也会考虑精选摘要。 即使网页详情被提升为精选摘要,我们也不会在搜索结果的第一页重复显示此列表。这样有助于整理搜索结果,帮助用户更轻松地找到相关信息。

完全匹配网域系统

我们的排名系统会将域名中的字词视为判断内容是否与搜索相关的众多因素之一。但是,我们的完全匹配网域系统会确保,对于专门为了与某些查询完全匹配而创建的网域下托管的内容,我们不会过多考虑。例如,用户可能会创建一个包含“最好吃的午餐饭馆”字样的域名,希望该域名中的所有这些字词都能提升内容的排名。我们的系统会做出相应调整。

更新系统

我们有各种“查询应保持新鲜度”系统,旨在针对查询显示预期的更新鲜内容。例如,如果有人搜索的是刚上映的电影,他们可能想要的是最新影评,而不是自影片制作开始以来的旧报道。再举一个例子,一般情况下,搜索“地震”可能会返回有关地震准备和资源的内容。不过,如果近期发生了地震,那么可能会出现新闻报道和较新的内容。

实用内容系统

我们的实用内容系统旨在确保用户在搜索结果中看到由用户撰写、面向用户的原创实用内容,而非主要用于获取搜索引擎流量的内容。

我们拥有多种系统,能够了解网页之间的链接方式,从而确定网页相关内容,以及哪些网页可能与查询最相关。其中就包括 PageRank,这是 Google 首次发布时采用的核心排名系统。对此感兴趣的人可以参阅原始的 PageRank 研究论文专利来了解详情。 自此之后,PageRank 的运作方式发生了很大变化,并一直是我们核心排名系统的一部分。

本地新闻系统

我们有相应的系统,负责识别和适时展示当地新闻媒体,例如通过“焦点新闻”和“本地新闻”功能。

MUM

Multitask Unified Model (MUM) 是一种能够理解和生成语言的 AI 系统。它目前不用于 Google 搜索的一般排名,而是用于某些特定应用,例如用于改进 COVID-19 疫苗信息的搜索改进精选摘要标注

神经匹配

神经匹配是一种 AI 系统,Google 使用它来理解查询和网页中概念的表示形式,并将它们相互匹配。

原创内容系统

我们有相应系统来确保在搜索结果的显眼位置显示原始内容(包括原创性报告),并将它们排在引用内容前面。其中包括对特殊规范标记的支持,如果网页在多个位置存在重复版本,创作者可以使用该标记来帮助我们更好地了解哪个是主要网页。

基于移除的降位系统

Google 的政策允许移除某些类型的内容。如果我们处理了涉及特定网站的大量此类移除要求,我们将以此作为衡量因素来改进我们的搜索结果。具体而言:

  • 依法移除:如果收到大量涉及特定网站的有效版权内容移除要求我们会据此降低该网站中其他内容在搜索结果中的排名。这样,如果存在其他侵权内容,用户更可能看到原始内容,而非相应侵权内容。对于涉及诽谤、仿冒产品和法院命令移除的投诉,我们会采用类似的降位衡量因素。
  • 个人信息移除:如果我们处理的大量个人信息移除要求涉及某个采用有偿移除做法的网站,我们会降低该网站中其他内容在搜索结果中的排名。 我们也会设法了解其他网站是否存在同类行为;如果存在,则对此类网站上的内容采取降位措施。对于收到大量人肉搜索内容移除要求的网站,我们可能会采取类似的降位做法。此外,我们还采取了自动保护措施,以防止未经当事人同意而发布的露骨个人图片在涉及相关姓名的查询中获得较高的排名。

段落排名系统

段落排名是一个 AI 系统,用于识别网页的各个部分或“段落”,以便更好地了解网页与搜索内容的相关程度。

RankBrain

RankBrain 是一个 AI 系统,可帮助我们了解字词与概念之间的关系。这意味着,即使内容不包含某个搜索查询中使用的所有完全匹配的字词,我们也可以了解这些内容与其他字词和概念的相关程度,从而更好地返回相关内容。

可靠信息系统

多个系统以各种方式显示尽可能最可靠的信息,例如帮助呈现更权威的网页和降低劣质内容的排名,以及提升优质新闻的排名。 如果可能缺乏可靠的信息,或者我们的系统对搜索结果的总体质量不太有信心,我们的系统会自动显示有关快速变化的主题的内容建议。这些内容建议会提示您如何找到可能更实用的搜索结果。详细了解我们在 Google 搜索中提供优质信息的方法

评价系统

评价系统旨在更好地奖励优质评价,其内容包含见解深刻的分析和原创研究,并且由熟知相应主题的专家或爱好者撰写。

网站多元化系统

我们的网站多元化系统可确保我们一般不会在热门搜索结果中显示来自同一网站的两个以上的网页商品详情,这样就不会有单个网站霸占热门搜索结果。不过,如果我们的系统发现,同一网站的两条以上的商品详情与特定搜索非常相关,可能仍会显示两条以上这样的商品详情。网站多元化系统通常将子网域视为根网域的一部分。IE:系统会将子网域 (subdomain.example.com) 和根网域 (example.com) 中的商品详情视为来自同一个网站。不过,有时出于多元化目的,会将子网域视为不同的网站。

网络垃圾检测系统

没有人希望电子邮件收件箱充满垃圾邮件,因此垃圾邮件过滤器非常有用。 Google 搜索面临着类似的挑战,因为互联网包含大量网络垃圾,如果不处理这些网络垃圾,系统将无法显示最有帮助且最相关的结果。我们采用了一系列的网络垃圾检测系统(包括 SpamBrain)来处理违反网络垃圾政策的内容和行为。 这些系统会不断更新,以便及时掌握网络垃圾威胁的最新演变方式。

已经弃用的系统

下文所述的系统主要用于历史参考用途。它们已被并入接替系统,或已成为我们核心排名系统的一部分。

蜂鸟系统

这是我们在 2013 年 8 月对整体排名系统进行的一项重大改进。此后,我们的排名系统一直在不断发展,就像它们之前一直在发展一样。

熊猫系统

该系统旨在更好地确保在 Google 搜索结果中呈现优质的原创内容。我们于 2011 年宣布推出这个昵称为“熊猫”的系统,该系统经过不断发展,于 2015 年成为我们核心排名系统的一部分。

企鹅系统

这是一个旨在防范垃圾链接的系统。我们于 2012 年宣布推出这个昵称为“企鹅更新”的系统,并在 2016 年将其整合到我们的核心排名系统中。