这篇文章主要介绍的是如何提高有效页面的收录数量的流程,步骤或者是思路,见仁见智,根据网站实际情况出发,效果更会好点,但是套路具有普适性,所以本文值得认真研读。
开篇之前,再次回顾一个公式,叫做SEO流量公式,这个公式虽然不是全对,但是能够延伸出所有的SEO运营操作点,所以需要反复咀嚼,更需要时刻拿出来装逼用。
SEO流量公式:SEO流量=搜索需求覆盖率*收录量*排名*点击率
总此公式出发,假如搜索需求覆盖率,排名和点击率这三个值是确定的,那么只需要增加收录量就可以增加流量了。然而收录量的只是单纯的收录量(天真脸)吗?
科学尚未普及,思维上的粒度还需要再次细分:
收录量=无效收录量+有效收录量
所以从运营的角度出发做收录量的核心是:增加有效收录量,冷处理无效收录量(冷处理就是不理他,先放着)
再次细分,增加有效收录量需要从两方面出发:
(2)增加有效页面的爬取量。单独一个网站的蜘蛛资源在一个阶段是有限,每天派出4000蜘蛛爬取,这个资源量一般不会突然发生暴增,所以这里就需要nofollow和sitemap去引导蜘蛛爬取有效页面,具体如何引导可以参考这两篇文章:
基于抓取策略的htmlsitemap
我也谈一下nofollow
第一点就是增加有效页面数量,这也是本文讨论的主旨,我给出的参考文章你可以看完本文之后再去点击扩展阅读,下面我们继续来谈有效页面数应该如何系统流程化的增加。
定义标准
1,有(强)排名价值的。一个页面可以过排名获取流量,就必然有收录价值。也就是说排名价值是判定其是否有收录价值的充分条件。典型类型有:网站首页、专题页、列表页、详情页等。
2,无(弱)排名价值,但可以帮助搜索引擎直接或间接抓取其他排名价值页面。关键特征:页面上有大量指向其他页面的链接,但自身没有显著的排名意图。典型类型有:列表页、索引页,栏目页等。
3,无(弱)排名价值,但可以提升整站权重。这类页面常见于海量文章页、贴子等。通过UGC创造的页面大多数可以归为此类。不过,这些海量的页面,除了可以极大提高整站权重,其整体排名价值又往往超过了网站其他所有有效页面。这是非常有意思的现象。页面数量越多的网站,这个表现越明显——很多你压根想不到的词,这些词大部分只被检索过一次,带来的流量超过了整体的一半。
关于有效页面数据库搭建流程,可以单独写一篇比较长的文章。这里做框架性阐述。
主体、意图、属性A(可能还有B、C、D等)、记录A(可能还有B、C、D等)、页面类型以及URL。
举例大概可以设计下面这个样子
2.拿到字典表
页面各个字段参数与记录对应关系构成了字典表。
大概可以设计下面这个样子
注意:最好加上主体、意图、属性这三个字段。随着网站结构复杂,记录上完全一样的词,对应的参数很可能不一样。所以需要加上主体、意图、属性来加以细分。
1,应当有效页面。与查询覆盖完全匹配的理想页面,也是我们最终想要拿到的。实际操作中,无法一蹴而就得到。
2,组合有效页面。通过字典结合规则组合得到。应当有效页面和现存有效页面都是其子集。但是组合有效页面往往会出现一个问题,由于规则很难以过于精细,组合出来的会产生超出查询覆盖边界。
3,现存有效页面。网站数据库现有的有效页面。这部分页面有两个的局限性表现。1)可能各种各样的原因,比如由于数据不全,会导致现存有效页面往往小于应当有效页面。2)这部分有效页面是遵循组合规则生成,也会出现现存有效页面超出应当有效页面的情况。
三者关系见下图:
4、拿到最终的应当有效页面,需要建立在组合有效页面和现存有效页面的基础上。
(3)结合组合有效页面、现存有效页面以及内容数据,补全现存页面缺少部分,剔除现存页面超出部分。
前面说过,最终是要拿到应当有效页面数据。但从动态的角度来看,应当有效页面数据是没有最终静止形态。因此,有效页面数据的应用,除了是为了不断逼近应当有效页面,更多的是在逼近过程中的应用。
拿到有效页面数据,大家可以尽情的发挥自己的想象力,怎么用得效率高,怎么用得爽,就怎么来。只要在整个SEO运营公式的框架下,结合实际情况,可以通过各种各样的方式利用起来。
在主体、意图、属性、记录、URL的基础上,继续增加想要关注的字段。比如Title、H1、状态码、关键词、收录等。
应用主要有三个方面
1,记录。有的放矢地记录,每个版本都可以往回查找。记录是复盘的前提。
2,监测。尽早发现变化,如内容的修改,收录排名变动等。
3,优化。结合记录和监测,可以预知趋势,可以总结操作得失。基于未来和过去,才能做出合理的优化判断。
举个监测规避风险的场景
大中型网站,由于其复杂性以及数据量大,一些对SEO影响不好的操作,往往会等等实质性结果出来了,才后知后觉。比如程序的一个小操作,导致了某类页面的Title变了个样,H1标签丢失等等。看到这里,真让人有点怕怕。
如果某类页面状态码都变成了404,看到这里,已经恐怖如斯了,这SEO工作真心没法搞了。所以需要一些监测机制来预防和提前发现。前面说到的添加更多需要关注的字段,就是形成机制的若干要点。
最后说明的是,以上内容是搭建有效页面数据库的简单思路,这么看下来可能没有实际操作的参考价值,如果实在无法落地就忽略吧,只要做到网站的每篇文章都注意内容就行了。