SEO 处理对象更加清晰明确,有的放矢,尽可能规避无效功课。有效页面数据库,你只需要关注有效页面的抓取情况,有效页面的收录情况。你要做的都是针对有效页面做页面增长、页面改进。不属于有效的页面的抓取、收录,都是你要摒弃的。搜索引擎分配给你网站的抓取量是相对恒量的。从常识出发,很容易就理解到建立有效页面数据库的意义。另外,有效页面数据库的建立,对新人快速熟悉上手有很好的帮助,也是团队良好协作的一个基础。这种好处,在大型网站表现的尤为突出。
有效页面的定义
定义:有效页面就是有收录价值的页面。
定义标准
1,有(强)排名价值的。一个页面可以过排名获取流量,就必然有收录价值。也就是说排名价值是判定其是否有收录价值的充分条件。典型类型有:网站首页、专题页、列表页、详情页等。
2,无(弱)排名价值,但可以帮助搜索引擎直接或间接抓取其他排名价值页面。关键特征:页面上有大量指向其他页面的链接,但自身没有显著的排名意图。典型类型有:列表页、索引页,栏目页等。
3,无(弱)排名价值,但可以提升整站权重。这类页面常见于海量文章页、贴子等。通过 UGC 创造的页面大多数可以归为此类。不过,这些海量的页面,除了可以极大提高整站权重,其整体排名价值又往往超过了网站其他所有有效页面。这是非常有意思的现象。页面数量越多的网站,这个表现越明显——很多你压根想不到的词,这些词大部分只被检索过一次,带来的流量超过了整体的一半。
大中型网站,由于其复杂性以及数据量大,一些对 SEO 影响不好的操作,往往会等等实质性结果出来了,才后知后觉。比如程序的一个小操作,导致了某类页面的 Title 变了个样,H1 标签丢失等等。看到这里,真让人有点怕怕。如果某类页面状态码都变成了 404,看到这里,已经恐怖如斯了,这 SEO 工作真心没法搞了。所以需要一些监测机制来预防和提前发现。前面说到的添加更多需要关注的字段,就是形成机制的若干要点。