JAVASCRIPT SEO 完全指南

JAVASCRIPT SEO 完全指南有一些 SEOs 还停留在 “ JavaScript 对 SEO 不友好 ” 的阶段,但其实 JavaScript 已经成为目前 WEB 生态不可缺少的一项技术,并且 Google 早就实现了对 JavaScript 的支持,比如 Google 已经可以识别 JavaScript 中的内容

John Mueller 在 2017 年也说过:

作为 SEO 应该注意到:WEB 已经不再是单纯 HTML 的。SEOs 需要学习一些 JS 开发知识,以及 JS SEO 内容。JS 也不会消失。

JAVASCRIPT SEO 完全指南

补充:百度也有渲染爬虫,并对 JavaScript 内容进行识别。因此,本文对百度 SEO 同样适用

JavaScript SEO 是什么

JavaScript SEO 是技术 SEO 的一项,可以帮助基于 JavaScript 技术的网页实现 SEO 友好,比如抓取、渲染和收录等核心环节,另外也可以优化网页性能,提升用户体验。

Googlebot 如何处理 JavaScript 内容

我们先看下 Googlebot 现在的机制,是如何识别到 JavaScript 中的内容。Googlebot 之前只有 “网址发现 – 抓取 – 索引” 这 3 个环节,现在加入了 “渲染” 环节,主要就是增强了 JavaScript 内容的识别。以下是 Googlebot 目前的几个阶段:JAVASCRIPT SEO 完全指南

  1. Googlebot 通过 sitemap、网页抓取的方式,将发现到的 URL 汇总成 URL 队列
  2. Googlebot 按照队列对 URL 分别抓取
  3. Googlebot 将已抓取网页加入渲染队列,用无头 Chromium 对网页进行渲染,并执行 JavaScript,获取 JavaScript 内容
  4. 如果网页被判断有价值,Googlebot 将网页纳入索引库

所以,主要是 Googlebot 加入了渲染环节,导致 Googlebot 可以识别出 JavaScript 中的内容。

但需要注意的是,并不是所有内容 Googlebot 都能获取到。需要一些事件触发才展示的内容(比如滚动、点击),Googlebot 是不一定能获取到的。注:图中的呈现,就是渲染,翻译问题。

JavaScript SEO 优化指南​

JavaScript SEO 主要有内容可识别、链接 SEO 友好、懒加载 SEO 友好、网页性能优化、AJAX 可抓取等 5 个方面,还有几点注意事项。

1. JavaScript 内容可识别

JavaScript 内容优化,是要确保 JavaScript 内容可以被抓取和渲染比如 Alibaba.com 的这种方式:JAVASCRIPT SEO 完全指南

先加载一个前端框架(在 CDN 上,可实现秒开),接着使用 JavaScript 动态加载内容。SEO 需要检查 Googlebot 是否能真正能抓取到自己网站的内容,主要有 3 种工具:GSC 的网址检查工具Google 的移动设备适合性测试,以及 Google 快照这里重点分享下 GSC 网址检查工具的用法:使用 GSC 的网址检查,“测试实际网址”,然后点击“查看被测试的网页”。在右侧的源代码就是 Googlebot 抓取 + 渲染后的 HTML 代码了。你可以在这个 HTML 里查看核心内容是否被 Googlebot 抓取到。

JAVASCRIPT SEO 完全指南

再附赠个小技巧,可以将爬虫看到的的 HTML 源代码复制下来,在 Chrome 中随便打开一个网页,按 F2 将这部分 HTML 内容复制进去,然后敲回车。这样浏览器中看到的内容就是 Googlebot 看到的内容。另外,Google 的移动设备适合性测试跟网址检查工具类似,Google 快照就是看快照是否包含核心内容。

2. JavaScript 链接 SEO 友好

因为 Googlebot 是按照 URL 进行抓取和索引,所以链接中要出现可抓取和索引的 URL,不要使用 JS 链接和锚点链接。以下是几个 cases:Good:

<a href=”/page”>简单友好</a>
<a href=”/page” onclick=”goTo(‘page’)”>仍然友好</a>

Bad:

<a onclick=”goTo(‘page’)”>不友好,没使用 href 属性</a>
<a href=”javascript:goTo(‘page’)”>不友好,不是可用的链接地址</a>
<span onclick=”goTo(‘page’)”>不友好,没有用 a 标签</span>
<a href=”#page”>不友好,是锚点,不是单独的 URL</a>

3. 懒加载 SEO 友好

懒加载是目前 WEB 翻页的常用方式,尤其是移动端。但懒加载尤其需要注意对 SEO 友好。因为 Googlebot 并没有滚动行为,而是采用调整屏幕长短的方式来获取更多内容。以下是 Googlebot 调整屏幕长短的示意图:JAVASCRIPT SEO 完全指南

我先放上一段对 Googlebot 不友好的 JavaScript 实现方式。这个方式之所以不友好,是因为主要依赖滚动行为来触发内容的加载:JAVASCRIPT SEO 完全指南还一段对 Googlebot 友好的 JavaScript 实现方式,这个方式是采用监听元素可视化的方式来触发内容加载,对 Googlebot 是友好的JAVASCRIPT SEO 完全指南

另外,也有原生的 lazy-loading 元素,不过目前只有 Chrome 支持,且是实验阶段,要谨慎采用。

4. 网页性能优化

网页速度是排名因素之一,因此建议对网页性能进行优化,可针对 lighthouse 分数进行优化。以下简单列几个 JavaScript 优化的部分:

  • 减少 JavaScript 请求量、文件大小
  • 避免 JavaScript 阻塞核心内容的加载
  • 核心 JavaScript 内容嵌入网页
  • JavaScript 文件可放在 CDN 上,并加缓存

5. AJAX 可抓取

部分 AJAX 网站使用 # 作为 URL,但实际上 Googlebot 会将 # 看作是网页的锚点,并将 # 后忽略掉。因此 AJAX 网站也使用 #!的方式保证可抓取,而不是使用 # 的方式。Good:www.example.com/ajax.html#!mystate

Bad:www.example.com/ajax.html#mystate

JavaScript SEO 还要避免什么

除了以上 5 个优化方面,JavaScript SEO 还要注意避免以下几点:

  • 避免 JavaScript 和 CSS 文件被屏蔽,包含 robots.txt 和服务器端的屏蔽等
  • 避免 JavaScript 错误,比如超时等

另外的解决方案

JavaScript SEO 还有 2 个解决方案,这两种会更完整,成本也不低:第一种是服务器端呈现或预呈现。这是 Google 推荐的实现方式JAVASCRIPT SEO 完全指南第二种是动态呈现,即针对爬虫有单独的呈现方式JAVASCRIPT SEO 完全指南这 2 个方式也可以结合起来。

另外,History API 也是翻页时友好的使用方式。History API 可以实现滚动时自动加载,且可保证 Googlebot 的抓取。

最终建议

如上所述,JavaScript SEO 需要注意内容可识别、链接 SEO 友好、懒加载 SEO 友好、网页性能优化、AJAX 可抓取这 4 个方向,还要注意避免 JavaScript 的屏蔽和错误。

整体上,Google 仍建议使用服务器端渲染(SSR)和预呈现的方式,因为这样可以让用户和爬虫更快的看到网页内容,而且并非所有爬虫都能运行 JavaScript。

推荐 2 个 Debug 插件

View Rendered Source – Chrome 插件

View Rendered Source 可以看到网页的渲染前和渲染后的 HTML 代码,并给出两者的差异。不光如此,还可支持 PC 和 Msite,可模拟 Googlebot。让我看了不禁感叹:这才是真正的 SEO 产品工具!

SEO Pro extension – Chrome 插件

SEO Pro extension 是个查看网页 SEO 元素的插件,并且使用的是网页渲染后的 HTML 源码,并不是渲染前的。所以可以手动点击,查看网页元素的加载情况。

版权声明:本文内容以盗版加工为主,原创为辅,意在分享,收藏,记录工作中的点点滴滴。不代表任何组织,不代表任何商业机构,也不代表我个人所有想法。
心晴客栈 » JAVASCRIPT SEO 完全指南

发表回复