如何通过IP地址看网站日志来寻找百度蜘蛛爬行规律?



2008-07-03 05:10:33 北京时间

如何通过IP地址看网站日志来寻找百度蜘蛛爬行规律?

对于各位站长来说,百度的收录是关心的重中之重。
了解百度蜘蛛的爬行规律从而更好的改善收录情况也是必须要掌握的。
很多网站目前使用的都是虚拟空间,都能够提供日志。
日志是指在网站根目录下的logfiles文件夹里面日期.txt文本文件
有很多介绍通过http查看返回命令的那种办法来查看蜘蛛,这里就不介绍了。
现在更多的网站是没有提供可以通过软件来查看的日志格式。
更多的是类似北京礼品网网站www.lipin-bj.cn的日志格式,如下:
03:28:34 GET /goods.php 202.108.7.205 200 34696 390

第一 03:28:34 访问时间
第二 GET /goods.php 访问的页面 get表示获取
第三 202.108.7.205 访问网站的源IP
第四 200      成功访问
第五 34696 390 表示记录的内容大小

都是这种格式的日志如何去分析了,一个一个看的头都大了。
商务礼品网站www.lipin-bj.cn的日志记录每天都有1M多,上千条记录岂不是会看都头晕眼花。

注意了,告诉大家一个窍门。经过长期观察发现,百度的蜘蛛的来源服务器IP地址都是属于
一个域下面的通个网段。什么意思了,就是全部都是以202.108开头的IP,IP地址都是类似于
202.108.X.X。这个网段的IP地址是位于北京网通电报大楼,属于全国互联网核心骨干机房,现在
此IP段已经绝迹了。
那么调出你的日志,用ctrl+f查找一下有没有这个网段的IP。有的话就在查找一下访问的时间,
那么就可以找出来百度蜘蛛访问你网站的时间规律了。对于更新内容的作用那是杠杠的啊。

最后,礼品经验www.lipin-bj.cn 欢迎大家拍砖,绝对原创自己的心得。转载请留名,谢谢!

 




发表评论

请文明参与讨论,禁止漫骂攻击。本站保留不刊登无关和不雅评论的权力。


用户名: 密码: 匿名

相关新闻
大家好,国庆节过了,祝大家节日快乐,特别要祝是守候在群的一线
最近和国内某著名VC闲聊SNS的发展趋势,他突然问:为什么大家都
最近一次的Google Pagerank的更新,很多博客的PR降低了,而门户
按正常的理论来说,一般成功的站长,多多少少头脑都有点问题!也
有些链接买家们在购买链接时大部分只注重百度收录,不在乎其他搜

广告
© 2008 The Czz5 Company. All Rights Reserved. 关于我们 - 联系我们 - 广告业务 - 网站地图 - 版权声明 - 友情连接 - 网站投稿 - 致信编辑