SEO 三部曲之 SEO 三大系统
随着网站规模和流量的增长,SEO 不可避免会遇到跨平台、多维度的数据、复杂的功能和配置、以及海量、分层的关键词,这个时候就需要 SEO 系统来辅助决策,提高运营效率。我总结了日常工作中使用的 3 个系统,分别是 SEO 数据系统、SEO 运营系统、词库系统。
SEO 数据系统
SEO 数据系统是监控 SEO 各项数据,包括过程数据和结果数据、内部数据和外部数据,也是对 SEO 增长公式中各要素进行监控,有点像是太空舱中的各个显示屏,数据在不停的滚动。主要有以下几个数据项:
- 流量罗盘
- 主要有 UV 数据、转化数据和用户数据。并且有分频道、地域、新老用户等多个维度
- 百度统计、Google Analystics、CNZZ 就是这类工具
- 抓取监控
- 对爬虫的抓取环节进行监控,重点监控的数据有:总抓取量和不重复抓取量、平均下载时间、爬虫总量等
- 主要是对网站 log 进行分析,市面上好像没有此类工具, Shell 或 Python 应该是比较简单的实现方式(我之前在途牛用 shell + Django 实现过)
- 收录监控
- 监控网站收录情况,主要有总收录量、各频道收录量和收录率等
- 百度站长工具和 GSC 就有数据,也可以搭配上自己实际抽样调查的数据
- 排名监控
- 监控关键词排名情况,需要分层监控,比如对关键词类型、搜索量和所在频道进行分层,比如品牌关键词、热门关键词和长尾关键词的分层
- 排名工具比较常见,官方的、第三方的、自己开发的都有
- 网页性能监控
- 监控网页性能,也就是网页速度,包含 TTFB、首屏时间、渲染完成时间等(如果有条件,可以咨询下公司的前端同学)
- 其中 TTFB 直接影响爬虫抓取速度,首屏和渲染完成时间是影响用户体验,在 WAP 端尤其重要,而且已经是排名的影响因素
- 性能监控和分析工具有特别多,比如监控包、Chrome 的 Lighthouse、Gtmetrix 等
- 网页状态码监控
- 监控网页状态码,也是监控服务器的健康情况
- 竞手数据监控
- 对竞手的流量、排名、关键词数量进行监控
- 知己知彼。有些时候流量下降,只是因为对手的排名上升了
- 主要用第三方工具,比如 5118、SEMrush、Ahrefs 等
- 搜索引擎监控
- 搜索引擎的调整对网站流量有直接的影响,比如算法、广告、样式、特殊展现的调整,每个 SEOer 都被算法折磨过 🙁
- Google 算法监控我一般会用 Algoroo、SEMrush Sensor
SEO 运营系统
SEO 运营系统是对 SEO 各元素、参数、可配置项进行控制和管理,就像太空舱中的按钮、操纵杆。主要有以下几部分:
- Sitemap & Robots 管理
- 管理搜索引擎爬虫的抓取环节,给搜索引擎提交的哪些网页,禁止爬虫抓取哪些网页
- 内外链管理
- 管理网站的内链和外链(主要是内链),包含覆盖哪些网页,链接的倾斜程度
- TDK 管理
- 对网页 TDK 进行精细化管理,不过实际发现人工成本很高
- SEO 组件管理
- 管理网页中会有一些 SEO 组件,比如内容组件、链接组件、H1 等,可以对这些组件进行管理
- SEO 实验工具
- SEO 作为黑客增长的一种方式,实验是不可或缺的
- SEO 实验工具可以控制各项试验是否开启,参与实验的数量和比例,以及观测实验数据,记录实验结果
- 内容管理工具(CMS)
- 对 SEO 频道应用的内容进行管理,比如途牛的攻略文章
- 抓取系统
- 这个抓取系统主要是抓取外部数据,比如竞手关键词、搜索引擎的数据、外部的文章内容等
- 也可以用 火车头,Python 的 Scrapy 来实现
- 页面诊断工具
- 页面诊断工具主要对新上线的页面进行自动化的诊断,比如检查是否缺少 TDK、适配代码等
SEO 词库系统
SEO 的主要生产要素之一是关键词,所以把词库单独拎出来作为一个系统。主要有以下几个功能
- 筛选 & 过滤机制
- 新增关键词时进行自动化的筛选和过滤,主要是搜索量、相关度、产品数量等
- 上下线机制
- 建立关键词自动上下线机制:对于实际效果差的关键词,进行下线处理;对于重新产生价值的关键词,进行上线处理
- 自动化挖掘
- 从多个来源定期挖掘关键词,保证词库的活力
- 数据关系匹配
- 关键词数据跟抓取、收录、流量、内外链数据进行匹配,对关键词进行多维度的审视,并制定数据模型进行下一步的自动化调控
- 频道分配
- 根据关键词的搜索量、类型、语向进行不同频道的分配
- 类目预测
- 对关键词的类目、属性进行自动化判断
- 语向识别
- 识别关键词的语向
- 违禁词同步
- 跟集团违禁词保持同步,避免违规,减少风险
注意事项
首先要说明的是,以上 3 个系统及功能是理想情况,即便是阿里,也未完全实际完成。(部分已经完成;部分未产品化,以 SQL、Excel 来表现);其次,以上系统主要是根据我所在项目儿总结,并不完善(比如转化系统是缺失的),也不一定适合其他网站和项目,可以选取部分来使用和参考;最后,建议在实现过程中,尽量用开源软件,避免重复造轮子,减少开发成本。