2023 年 5 月 Google SEO“咨询交流时间”活动

这是 2023 年 5 月这一期 Google 搜索引擎优化 (SEO)“咨询交流时间”活动的转写内容。如需针对特定网站的帮助,建议您在 Google 搜索中心帮助社区中发帖咨询问题。

Duy:Kholizio 询问,如果网域受到惩罚,该网域的出站链接是否会受到影响?

对于“惩罚”一词,我的理解是某个网域被我们的网络垃圾算法或人工处置措施降位。一般情况下,答案是肯定的,我们不会信任与已判定为网络垃圾的网站相关的链接。这有助于我们保持锚标记信号的质量。

不同的网址测试工具是否会生成不同的结果?

Martin:Ellen Edmands 询问,网址检查工具和富媒体搜索结果测试工具在呈现 HTML 标签页时,是否会生成不同的结果?

一般来说,它们会生成相同的结果。不过,在生成结果时,有两种不同的方式:通过 Google Search Console 中的“查看被抓取的网页”标签页,使用索引编制流水线;或者在 Google Search Console 中使用实时测试或在富媒体搜索结果测试工具中进行实时测试。两种实时测试都会跳过缓存,按当前状态展示网页当前版本的呈现结果。因此,实时测试不会进行缓存,也不会发生缓存超时,对呈现的输出造成影响。根据超时发生的时间点或是否发生超时,HTML 的呈现结果可能会有所不同。但是在我们的基础架构中,这些呈现结果是使用完全相同的路径生成的。

我想针对目录网站和社交书签网站进行页外搜索引擎优化 (SEO) 提交,这种做法是否值得一试?

Gary:Shantanu 询问,我想针对目录网站和社交书签网站进行页外 SEO 提交,这种做法是否值得一试?

我很喜欢这个问题,它让我想起 15 年前我做 SEO 的时候!简单地说,我不会把宝贵的时间花在目录提交和社交书签上。因为这样做可能会导致时间浪费在完全没有帮助的事情上。

为什么在我的网站上,集合页面被标记为 noindex 而遭到排除?

John:为什么在我的网站上,集合页面被标记为 noindex 而遭到排除?

我仔细查看了问题中提到的网站。简而言之,这些网页主要是该网站上已分页的类别网页,而且它们确实都带有 noindex robots <meta> 标记。对于这类问题,可以检查 Search Console 中指定的确切网址。最快捷的操作是,在浏览器中打开相应网页,使用 view-source,然后搜索“robots”查找 robots <meta> 标记,并搜索“googlebot”查找 Googlebot <meta> 标记。某些网页可能有多个这样的标记。在检查这个问题时,我发现这些网页使用了两个单独的 robots <meta> 标记,而且第二个标记包含 noindex。对于更复杂的情况,可能需要使用 Chrome 中的移动模拟功能,在开发者工具中使用“Elements 面板”来查看已加载的 DOM,或者使用 Search Console 的“检查网址”功能进行检查。对于这个问题,我猜测可能网站的电子商务平台中的插件或设置造成了这一结果,可能没有什么影响。

Duy:有人询问,我的网站上有些链接似乎是来自俄罗斯网站,如何能屏蔽这些链接?我认为这些链接会降低我的网站在搜索结果中的排名,损害到我的网站。

总体而言,我们的算法在识别和忽略互联网上的垃圾内容或垃圾链接方面做得非常不错。在某些情况下,此类内容可能会大量出现。您不必过于担心,只需把这个问题交给我们的系统来处理,您可以专注于改进您的网站。

网站后端设计是否会影响排名?

Martin:Eshragh 询问,网站后端设计是否会影响排名?例如,如果我们使用 WordPress、定制的 CMS 或任何特定编程语言来呈现 HTML,是否会对结果有影响?

没有影响,这通常并不重要。但是,从性能和行为的角度而言,却也有些影响。例如,如果您的服务器运行速度非常慢,则可能会对排名产生一些影响。

你们将来有没有可能会允许在摘要中使用多个网站名称?

John:Madeleine 询问,你们将来有没有可能会允许在摘要中使用多个网站名称,例如同时使用根域名和子网域?

我们关于网站名称的文档中提到,我们目前仅支持域名,不支持子网域。我无法保证未来会有何改变。从目前的一些改变来看,相关团队倾向于从该问题的某一方面着手,评估可行的解决方法,然后不断寻找更多突破口。不过,我们无法对未来的改变做出任何保证。

我有 16,000 个网页,将它们编入索引是不是需要 6 个月以上的时间?

Gary:Tom Baker 询问,我有 16,000 个网页,将它们编入索引是不是需要 6 个月以上的时间?我看到每周增加的数量大约是 5 到 15 个,这个速度很慢。

将网站编入索引的速度取决于许多因素,但最重要因素是网站的质量,其次是网站在互联网上的热门程度。如果您能将自己最高水准的内容发布到网站上,并尝试在社交媒体上投放一些宣传内容,或许就能促使您的网站成为人们热议的话题。这可能会对解决您的问题有所帮助。

对于固定链接,在网址中使用缩写“-wont-”来替代“-will-not-”是不是更好?

John:Michael 询问,对于固定链接,在网址中使用缩写“-wont-”来替代“-will-not-”是不是更好?“-wont-”实际上还有其他含义,不过作为一般要求,是不是有一项最佳做法建议不要将“-do-not-”替换为“-dont-”?

不过这不重要。一般而言,网址中的字词对 Google 搜索的影响非常小。我唯一的建议是保持一致,以免您意外地以不同方式链接到同一网页。此外,由于对搜索结果的影响非常小,但是更改整个网站的网址工作量却很大,所以我不建议您只是因为在某处看到了关于搜索引擎优化的某项含糊其辞的夸大内容,而去更改网站的网址。

如果图片网址中包含多个级别,Googlebot 是不是会很难抓取图片并将其编入索引?

Martin:Aman 询问,如果图片网址中包含多个级别,Googlebot 是不是会很难抓取图片并将其编入索引?例如:https://www.abc.com/ab/cd/content/category/image/hires/imagefilename.jpg

很高兴地告诉您,不会的。

Gary:匿名用户询问,有很多网络垃圾反向链接指向我的网站,如何能阻止这些链接?

很简单,不用理会它们。互联网是一个广阔的空间,您可能会收到很多“不请自来”的讨厌链接。我们处理这类链接已有 25 年时间,非常擅长忽略它们。所以我会忽略这类链接。如果您希望眼不见为净,可以使用 Search Console 中的拒绝工具

有没有可能 Google Search Console 会向我显示错误的查询?

John:Alexis 询问,有没有可能 Google Search Console 会向我显示错误的查询?

Search Console 中的效果数据是在您的网站因特定查询而得到展示时收集的。这些数据不是理论数据,而是根据用户搜索时向用户展示的内容统计的。就我而言,在看到无法理解的数据时,我会尝试通过缩小报告的设置范围来查找特定信息。该数据是否仅来自特定国家/地区?或者仅来自特定的搜索类型?有没有可能在极短的时间内发生了什么?有时,通过设置此类特定条件可以重现搜索结果,但也有可能某些搜索结果再也无法重现,或者有时能重现有时却无法重现。或许我们探索一番就能弄清数据的由来,但也有可能我们不得不承认暂时无法重现某些数据。

在呈现整个 HTML 网页时,我们对搜索引擎使用服务器端呈现,对用户使用客户端呈现。这样做可以吗?

Martin:Madeleine 询问,我们在提供某个网页的完整 HTML 内容时,对所有搜索引擎漫游器使用服务器端呈现 (SSR),并对用户使用客户端呈现。就 JavaScript SEO 而言,这样做是否合适?

我们将这种方法称为动态呈现。这样做会增加设置和维护工作的复杂程度,但是如果对您有用,也是可以的。不过,我们不建议对新项目采用这种做法,因为这也会给网站所有者增加额外的复杂性。这并非最佳解决方案,但只要行之有效,我认为不必弃之不用。

为图片提供描述性文件名称有多重要?

Gary:Al G. 询问,为图片提供描述性文件名称有多重要?

问的好!描述性文件名称通常帮助不大。但是,如果您在一个位置存放了大量图片(例如数以百万的图片),您就需要仔细考虑是否有必要添加描述性文件名称了。如果您只有少量分散存放的图片,而且它们的文件名没有问题,您在放置好这些图片后就不需要费力进行更改了。有关更多信息,请参阅我们的图片搜索引擎优化 (SEO) 最佳做法

在重新设计后,有什么好方法可以增加流量?

John:下一个问题是,在重新设计后,有什么好方法可以增加流量?

重新设计有很多不同的方法。有些网站经过重新设计后基本上会焕然一新,网址和网页结构都和以前截然不同。在这种情况下,您需要将重新设计视为网站迁移并进行重定向。否则,您的网站在重新发布后,流量可能会立即出现下滑。就您的情况来看,流量是在一段时间内逐渐下降的。我认为,重新设计并非是导致流量下降的主要原因,更有可能是搜索、网络或用户的行为或期望随时间推移发生了改变。这通常不是一个技术问题,而是需要您充分了解网站所处的现实世界,并尝试改进网站的匹配方式。这个问题无法简单解决,希望您理解!

在将 Googlebot 用于自然搜索抓取时,它会呈现抓取到的每一个网页吗?如果不会,它会多久呈现一次?

Martin:Jason 询问,在将 Googlebot 用于自然搜索抓取时,它会呈现抓取到的每一个网页吗?如果不会,它会多久呈现一次?

可能会,也可能不会。并非抓取到的每一个网页都会得到呈现。例如,如果抓取到返回 404 错误的页面,就不会进行呈现。但是我们抓取到的每一个正常网页,都会得到呈现。

网页中存在无效的架构标记会导致问题吗?

Gary:Matthias 询问,网页中存在无效的架构标记会导致问题吗?(例如,不含 offer / review / aggregateRatingproduct 标记

简单地说,不会。具体地说,还是不会,因为如果标记无法解析,就根本不会被使用。不过这也意味着,您可能会丢失某些搜索结果功能,例如摘要之下的丰富属性

如何从重定向 302 改为重定向 301

John:Hazim 询问,如何从重定向 302 改为重定向 301

关于这个问题,您需要与您网站的托管服务提供商或网域注册商协商解决。不过值得高兴的是,Google 搜索会将长期的临时重定向视为永久重定向,所以就目前而言,这个问题对您的网站没有重大影响。虽然理想的情况是使用理论上正确的重定向,但 Google 搜索也会尝试使用您提供的重定向(只要正确无误)。

大量的样板内容是否对网站造成不利影响?

Gary:Anan 询问,大量的样板内容是否对网站造成不利影响?我并不是指联系信息、隐私权政策等内容。谢谢。

一般不会,大量样板内容不会对您的网站在搜索结果中的显示情况有太大影响。尽管如此,您可能需要考虑大量样板内容带给用户的体验,因为用户可能对这类内容完全不感兴趣。

如何防止 Googlebot 在网页上呈现 JavaScript 时调用开销巨大的外部 API?

Martin:Matthew 询问,如何防止 Googlebot 在网页上呈现 JavaScript 时调用开销巨大的外部 API?

您可以使用 robots.txt 来禁止调用此类 API,但请注意:如果您使用客户端呈现,而相关网页内容依赖此类 API,则必须允许 Googlebot 访问此类 API 才能看到相关内容。否则,当 Googlebot 查看这些网页时,它们不会包含这些内容。对于无法使用 robots.txt 来禁止访问的外部第三方网址,您可以有条件地在 JavaScript 中加载此类 API,并在 Googlebot 请求抓取网页时跳过这些内容。

有没有什么具体方法可以在不影响 SEO 排名的情况下更改域名?

Gary:D.ray from mu.se 询问,有没有什么具体方法可以在不影响 SEO 排名的情况下更改域名?

精心实施的网站迁移(包括网域更改)应该不会造成流量持续流失,所以答案是肯定的:确实有一种方法可以在不影响排名的情况下更改域名。有关详情,请查看关于网站迁移的文档;我们也附上了其他来源编写的其他专家指南的链接。

我在一个多月前上传了品牌网站图标。但是,Google 上显示的还是我原来的 Webflow 网站图标。

John:Josh 询问,我在一个多月前上传了品牌网站图标。但是,Google 上显示的还是我原来的 Webflow 网站图标。请问如何解决这个问题,以便显示我后来上传的品牌网站图标?

我们提供了一份关于网站图标的帮助文档,您可以参阅该文档获取详细信息。另外,还应确保旧的网站图标不再存在于或关联到您的网站。理想情况下,您应将旧文件重定向到新文件。简而言之,请确保所有内容保持一致,不给搜索引擎留下产生误解的可能性。除此之外,有时这些更改需要经过一段时间才会显示。按说一个月时间已经足够,但是如果您发现了其他需要修正的问题,可能需要再等一些时间才能看到效果。最后,Google 外部人士 Glenn Gabe 总结了一份非常棒的网站图标问题排查指南,您可以在其中找到更多提示。

如果某个网站使用多种语言(人工翻译)撰写帖子,划分内容的最佳做法是什么?

Gary:V 询问,如果某个网站使用多种语言(人工翻译)撰写帖子,划分内容的最佳做法是什么?

这完全由您自己决定。无论您是像帮助中心提到的那样使用网址参数(例如 ?hl=ja),还是在网址路径中使用语言代码,从搜索角度而言都是可以的。您只需要确保每个语言版本都对应一个独一无二的网址即可。

John:Michał 询问,Google 是否接受诸如 <select><option value="https://www.examplepage.com">Page</option> 这样的链接?这种链接有效吗?

我们不会将此视为链接,不过我们可以识别出该网址并单独进行抓取。如果您希望某个内容被视为链接,请确保使用标准链接格式。我们最近发布了有关如何创建链接的指南,如果您的 Web 开发者对受支持的格式有任何疑问,我可以把相关链接发给他们。顺便提一句,这种 HTML 组合代码在浏览器中也不一定能作为链接使用,而是可以用于表单的下拉列表。

在 Google Search Console 中无法访问 robots.txt。这是为什么呢?

Gary:Aslam Khan 反映,在 Google Search Console 中无法访问 robots.txt。

如果 Search Console 报告您的资源存在无法访问 robots.txt 的问题,则表明您的网站或服务器出现问题,您必须修正问题才能在 Google 搜索中看到自己的网站。实际上,我们对这个问题也束手无策。我能想到的第一步是检查服务器的防火墙规则,看看屏蔽规则中是否有任何异常情况,然后再检查服务器配置文件。如果您不了解如何进行这些检查,请向托管服务提供商提交支持服务工单,他们最有可能为您提供所需帮助。

如果站点地图中提及了 hreflang 网址,<lastmod><priority> 等属性会对其产生什么影响?

John:Carlos 询问,如果站点地图中提及了 hreflang 网址,<lastmod><priority> 等属性会对其产生什么影响?

如果站点地图文件中指定了 hreflang 注解,您实际上是在引用其他网址。这将需要在 hreflang 集的所有网址中进行确认。但是如果了解何时抓取网址,情况就会有所不同。因为在抓取网址时,我们会查看该特定网址的属性,例如它的最后修改日期。不过有可能该网址的某一语言版本会单独发生更改,例如因为修复翻译问题而发生的更改。这意味着,尽管最后修改日期相对于其他信号只是一个非常粗略的信号,但仅靠这一个属性也无法保证网页很快就会被重新抓取。另外需要注意的是,抓取更多属性并不意味着网页的排名会提高,因此您不必尝试强制提高抓取频率。

Gary:Nick van Schaik 询问,我应该在 robots.txt 中屏蔽联属营销链接(以管理抓取预算),还是应该解除禁止,仅阻止将联属营销链接编入索引(使用 noindex 标记)?

在 robots.txt 中屏蔽联属营销链接可能是更合理的做法。虽然我们非常擅长识别和忽略联属营销链接,但是使用 robots.txt 禁止这些链接可以让您掌握主导权,也确实能让您更轻松地节省抓取预算。