【李守洪排名大师】如何分析网站日志
网站日志最重要是记录网站在运营过程中存在的各种问题,通过网站日志可以清楚地得知用户在什么IP、什么时间、用什么操作系统、什么浏览器、什么分辨率显示器的情况下访问了你网站的哪个页面,是否访问成功。
网站日志数据分析解读如下。
(1)访问次数、停留时间、抓取量
从这些项数据中可以得知:平均每欢抓取页面数、单页抓取停留时间和平均每次停留时间。平均每次抓取页面数=总抓取量/访问次数,单页面抓取停留时间=每次停留/每次抓取,平均每次停留时间=总停留时间访问次数。
(2)目录抓取统计
通过日志分析我们可以看到网站哪些目录受蜘蛛喜欢、抓取目录深度、重要页面目录抓取状况、无效页面目录抓取状况等。
(3)页面抓取
在网站日志分析中,我们可以看到具体被蜘蛛爬取的页面。在这些页面中,我们可以分析出蜘蛛爬取了哪些需要被禁止爬取的页面、爬取了哪些无收录价值页面、爬取了哪些重复页面URL等。为充分利用蜘蛛资源,我们需要将这些地址在Robots.txt中禁止爬取。
(4)蜘蛛访问IP
通过蜘蛛的IP段和前三项数据来判断网站的降权情况,IP分析的更多用途是判断是否存在采集蜘蛛、假蜘蛛、恶意点击蜘蛛等,从而对那些访问来源进行屏蔽、禁止访问处理,以节省带宽资源及减轻服务器压力,留给访客及蜘蛛更好的访问体验。