《
IIS日志分析工具之EXCEL数据透视表_》文章地址:http://www.tfxk.com/wangyesheji/jianzhanjingyan/110D122012.htm
然后依据门路进行查找相应的文件夹然,能够看到文件夹下有良多.log文件就是日志文件,而后通过FTP下载到本地。
然后将前4行删除,抉择A列,点击excel数据>分列>宰割符号
然后取舍A1列>右键>插入 然后将C,D,E,I列删除。在第一行分辨输入:日期,时间,网页,参数,端口,IP,蜘蛛,状况码 另外阐明一下参数,参数这个是动态网页面问号(?)后面的局部。 /5309_3.htm 这个路径后面的参数值为3,那么组合之后真是的URL就是 /5309_3.htm?3 因而解释蜘蛛仍是可以辨别参数的,有些网站投放广告后面常常都会带上参数进行统计,但经由抓取后参数都会被去除的。所以尽量不要在内容页使用此类的URL。
假如文件过大操作起来可能不方面,可以使用UltraEdit打开,筛查你想得到的数据(详细本人下载一个研讨下)。文件不是很大可以应用记事本直接翻开后复制到EXCEL。
点击标签筛选>包含>输入baidupider。既可以筛选出终极要看的网页的spider爬行时光具体数据,当然可以依照其他组合进行筛选各类数据,就不演示了。
互联网上剖析IIS的工具倒是不少,不外我不遇见可能合乎我请求的,个别的都是只能查问IIS日志内的蜘蛛匍匐的次数罢了。
1 2 下一页
下一步>其余>输入空格>下一步>完成。这样第一步就实现了。
-->
选中G列>数据>筛选>点击G列箭头>文本筛选>包括
输入baidupider 点击断定。即可看到所有百度蜘蛛拜访的数据,这样的话大抵的数据已经浮现出来了,如果查看google在筛选时候输入googlebot就可以了。随后制造一个简略的数据透视表便于分析。 一次顺序:插入>数据透视表>数据透视表>肯定 在右侧按先后次序勾选网页,蜘蛛,时间。然后点击蜘蛛后面的小三角,
首先必需有自己的服务器或者可以查看IIS日志的权限,通过FTP将iis日志文件从空间中下载到本地服务器获取IIS日志的方法:打开IIS,点击要查询网站>右键>属性>网站选项卡>属性>即可看到如图 如果是空间的话有些空间服务上会将日志文件放在网站根目录的。如果没有的话可以向服务商索取。
下面说个比拟简单且十分适用的方式,通过EXCEL的一些简单的公式做出想得到的一系列数据,例如时间距离,爬行页面,返回状态码,网址参数,蜘蛛类型,蜘蛛IP等,通过以上数据可 以进行对网站的问题的排查,更正。
相关的主题文章:
(责任编辑:网站建设)
IIS日志分析工具之EXCEL数据透视表_相关文章