网站日志分析及网站日志分析工具的使用方法

2019年11月5日20:28:23 发表评论

蜘蛛会不断的抓取新鲜的文件

怎么着日志文件目录?存于根目录以wwwlogs，log，logs等名称命名

没有log目录怎么办?联系主机商

为什么要看日志?

1、蜘蛛爬取过的文件(网页，css，js，目录，函数文件)

2、制定短期seo方案，改变一些已经制定却不太合理seo方法

工具：

Windows下的编辑器：Notpad++

日志各项参数：

1、访问IP：用户、爬虫、服务器(黑客服务器、IDC)

2、具体访问时间

3、请求：get真实访问，post发送数据

4、具体访问目录

5、状态码：200正常返回，40X 页面上的错误，50X 服务器上的错误

6、何种终端类型，火狐5.0

表格工作：

1、网站目录、文件、页面具体访问数量，统计一周

2、自己的网站更新频率统计

3、1、2点对比，将总结的最多的问题，列出来

状态码：

404页面处理方式： 1、删除;2、提交

301永久重定向，302重定向，304没变化

Loghao分析工具

1、先看404

2、有哪些是真正的百度蜘蛛

3、cmd Ping这些404 ip

1、仿冒的蜘蛛，自己的爬虫

2、竞争对手搞一下，入侵后台用

抓取异常的处理：

1、确认前端页面或者ftp文件可以正常访问

2、看一下百度抓取异常

(1)1正常，2报错，主机某一个时间段宕机，超时

(2)1不正常，2报错，不当操作造成的

沙盒期：

1、新站期1-3个月

2、大部分页面降权

沙盒标志：蜘蛛访问量，2个月以上，只有一个蜘蛛访问，索引量只有一个

1、域名有问题

2、Ip段有问题

3、同质化网站太多

版权声明：所有资源均来源于互联网,如有侵权请联系我们删除，
于2019年11月5日20:28:23，由 讲文兄 发表，共 621 字。
转载请注明：网站日志分析及网站日志分析工具的使用方法 | 「讲文兄博客」

网站日志分析及网站日志分析工具的使用方法

发表评论取消回复

微信

在线咨询

发表评论取消回复

登录 找回密码

微信

在线咨询

登录找回密码