对于一名SEO人员而言,我们每天需要解决的最直接的问题就是网站百度不收录的问题,但在很长一段时间里,实际上,我们认为,对于网站排名而言,并不是所有的页面都需要被百度建立索引。
我们没有必要花费大量的时间去为这些页面投入资源与建立索引。
那么,网站内部,哪些页面不用被索引?
根据以往搜索引擎优化技术的研究,蝙蝠侠IT,将通过如下内容阐述:
1、基础性页面
对于大量的新站,我们经常会遇到这样一个问题:那就是网站页面即使是收录了,也会存在很长时间没有排名的情况,产生这个问题的因素有很多,比如:网站结构设计的框架过大。
但其中最为直观的影响因子就是:页面存在大量的无SEO价值的链接,比如:关于我们,联系方式,留言板等。
由于新站到访的百度蜘蛛有限,如果你将更多的抓取频次浪费在这些页面上,那么,实际有价值的页面,就很难得到有效抓取。
2、网站翻页
网站翻页是一个我们经常讨论的话题,很长时间,我们经常忽略对站内翻页的研究,虽然随着搜索引擎算法的不断提升,百度已经可以精准的识别翻页的首页,而尽量避免给予更多分页的排名。
这个时候我们仍然需要自己去操作,只允许搜索引擎爬行分页,而不建立其他翻页的索引,这样就不会产生翻页之间的冲突。
你可以尝试利用两个策略:
①利用规范化标签Canonical去标注翻页的首选页面。
②利用dofollow,noindex命令,让蜘蛛只爬行,不索引。
3、聚合页面
我们知道聚合页面的作用,主要是将相关性的内容与页面整合到一起,而在实际操作中,大量的聚合页面完全是自动生成的,其主要的目的就是满足用户在站内浏览的用户体验。
而从SEO的角度,如果过度的利用系统程序自动生产,很可能会产生大量重复性的标签,这个时候,就会造成内部关键词排名冲突,往往得不偿失。
4、陈旧页面
理论上我们在做整站优化的时候,我们希望站内的每一个页面都在积极的发挥着作用,但随着时间的运营,我们一定会遇到一些陈旧性的页面,比如:
①电商网站的商品销售的过期页面(已经售空或者下架)
②内容资讯页面的旧闻。
③网络推广培训中的一些旧课程页面,早期的方法与策略,已经完全不试用。
总结:对于一个网站而言,我们不能完全要求每一个页面都得到有效的收录,特别是当你和SEO经理汇报工作的时候,需要明确的说明,甚至是一些企业主