《
网站日志分析 一种相对简单的分析方法》文章地址:http://www.tfxk.com/wangyesheji/jianzhanjingyan/030234A02013.htm
如果应用数据库查询,诚然可以得到一些结果,但查询过程过于复杂,数据量大的网站查询耗时太长,很难灵活利用到一般页面。本文提出一种相对简单的分析方法可以解决这个问题。
Tag:网站日志 网站日志  ,
网站整体与页面关键词分布;
先抛开这个问题,我们设想这样一个场景:在一个大会场中,熟人坐在某个座位上,如果我们晓得他们的地位,我们的眼睛很轻易聚焦到这几个位置,主动忽略其他座位的人,请参看图1。同样,人们在察看四周事物时,时常会把精神聚焦到本人关心的事物上,下意识忽略其他。我们曾经做过这样的试验,我们的讲演厅有4个很大的外置式扩音器,分列在两侧。留神不是那种不背眼的内置式,网站改版过程中注意的4个细节,任何人只有略微留意就会看到。而当我们请求会场的人闭上眼睛答复会场有几个扩音器时,很少有人能给出准确谜底,由于大部分人会关心更重要的货色,比方会议内容,发问问题,甚至是如何找个舒服的位子也比扩音器的多少更让人关心。
这种办法长处在于比较灵巧,如果网站的URL规则比较标准,在配置过程中可以多采取正则抒发式,从而可以发明更多有趣的景象。
回到我们网站遇到的问题,某个名目的设计师关心的页面并非全体,而只是多少个与之页面有关的页面和部门主要的指标页面。因而我们可以去除相关性不大的页面,只保留关怀页面,从而缩短用户路径,大大进步计算效力。
在网页经营改版过程中,常常有设计师或者运营共事有这样的疑难:我的页面到底产生了多大价值?这个页面领导的用户接下来访问了多少商品的页面?有不发生交易?有没有到我想让用户去的那些页面?
图2
另外,我们把索引的思维引入分析进程中,把网页的URL依照必定规矩(例如正则表白式)调换成简单字符,把相关性不大的页面统计替换为统一个字符(例如“0”),网站改版的过程的方法和误区,把一些过渡性的页面替代成某个字符(例如”p”),如斯以来,每个用户的访问路径就可以表示为一个字符串,例如”a,c,0,0,0,a,p,p,c,0,c,d,0,0,0”。也有的用户的访问路径全为相干性不大的页面,此时,路径为”0,0,0,0,0,0,0,0,0,0,0,0,0,0”,这表现用户并未访问到目标页面,如果不需要计算用户比例或用户分类,那么这样的记载我们可以删除掉。
假如需要保存其他的用户信息,例如cookieid,登录名,拜访时光等信息,这个字符串会更加庞杂些。如果我们研讨目标比拟简单,还可以进一步处置,如果不需要对步长信息进行分析,我们可以去掉相邻反复的一些数据,把上式简化为” a,c,0,a,p,c,0,c,t,0”。
每个用户在网站上的访问轨迹在网站日志或者数据库中,都是一串URL,有的只访问了一两步,有的访问了成千盈百步,如何在如此复杂繁多的数据中找到用户在访问某个页面(例如服装首页)之前或者之后n步,有多少人访问过特定页面(例如交易页面)?
因为目的页面业务的奇特性,网站改版后如何重拾搜索引擎好感,每次需要分析的方法也很个性化。门路查询器能够机动应答各种查询。例如,咱们须要计算a后面有t的人次,a后面紧随着c的人次,行动合乎某种模式的用户数有多少等等。需要统计的模式在分析算法配置文件(图2中的③)中进行配置,查问器会盘算并导出终极成果。
--> [
网站建设之]网站日志剖析:一种绝对简略的分析方式
这个过程请参看图2中的①跟②,由此我们可以得到多个用户的路径的字符串情势的文件。
另外,查询器还支撑分类信息查询,依据用户路径文件的配相信息,对每种分类的人群分辨查询,或者导出契合某种模式的人群Cookieid,用户名等,与其余数据存储媒介联接,获得这局部人群的其他信息,从而进行综合分析。
得到这个聚焦式用户路径文件后,我们就可以对这个字符串文件进行分析了。例如,我们需要计算a页面后有多少个c页面,需要能疏忽旁边的翻页页面(p页面)。在上例中的这个用户的字符串中,就是1个用户,2次c页面。如果在访问了其他页面之后再访问c页面的行为也可计算入内的话,那就是1个用户,3次c页面。
接下来就是分析的样本量问题。个别分析过程中会讲求&ldquo,网站改版十项注意事宜;多而全”,但数据量大到一定级别,分析1/10甚至1/100人群与分析全样本所得到的结果相差无几,破费良多资源去晋升一点准确度是一件很得失相当的事件。因此可以酌情分析小样本量,节俭分析本钱。
图1
(责任编辑:网站建设)
网站日志分析 一种相对简单的分析方法相关文章