您的位置:首页 > 运维架构 > Shell

用shell进行log分析--老狼

2015-06-10 14:19 411 查看
ITSEO学员老狼投稿文章首发,转载请注明出处!
锄禾日当午,日志分析为何非要费时一上午呢………………..一、开篇要说的话为何要日志分析昆哥说了:“首先要知道数据做什么用,怎么用,分析的意义在哪里!但是本身这个只是指导你工作决策的,不能太执迷! 我看很多人把大量时间都在折腾蜘蛛去了,也是不正确的方法!自己一定要搞清目的。。。。。“夜息说了:“日志分析关注的点要了解,要了解哪些维度,如何分析。。。。。“二、本文正题这里我就整理了下,本人经常拆份的一些项。Shell在Cygwin里跑的一些常用命令符语句,我用的是Windows下Cygwin……大牛的就就漂过。。。。【新手哈 有哪错的 望指点 学习,】现在把罗列下这些项://统计不重复抓取数量//统计所有状态码数量//统计某个目录抓取次数//统计各个目录出现404响应码次数//统计404页面的抓取数量//统计每个ip下对应URL的抓取次数//提取百度蜘蛛访问数量前10的网站目录及访问次数,并按降序排列//提取某个目录百度蛛蛛访问次数//统计首页抓取的次数占总体抓取次数比率//统计404响应码占总响应码比率//计算百度抓取总时间与总抓取次数//计算百度抓取总字节数//计算平均每次每个网页抓取字节数(小数点后面大于5进1)底下都举一个例子,大家就自己套用。。 欢迎评论提问,吐槽。。。指正。。。下面我们就进入演示。。。。请大家盯紧了。。这是我日志截图:



[b]//统计不重复抓取数量[/b]cat baidu.log | awk '{print $4}'|sort|uniq|wc -l


[b]//统计所有状态码数量[/b]awk '{print $10}' baidu.log |sort|uniq -c



[b]//统计某个目录抓取次数[/b]grep "/shop" baidu.log | awk '{print $4}' |sort |wc –l

[b]//统计各个目录出现404响应码次数[/b]

[b]//统计404页面的抓取数量[/b]awk '{if($10=="404"){print $0}}' baidu.log|sort|uniq|wc -l



[b]//统计每个ip下对应URL的抓取次数[/b]awk '{print $6,$4}' baidu.log |sort|uniq –c




[b]/提取百度蜘蛛访问数量前10的网站目录及访问次数,并按降序排列[/b]awk '{print $4}' baidu.log |grep -P "[^/(a-zA-Z)|^/(a-zA-Z)/]"|awk -F"/" '{print $2}'|sort|uniq -c|sort -r|head -10


[b]//提取某个目录百度蛛蛛访问次数[/b]cat baidu.log | grep “/shop/”| wc –lcat baidu.log |awk ‘{print $4}’ |grep “/shop/” |wc –l
cat baidu.log |awk ‘{print $4} |awk –F”/” ‘{print $2}’|grep “shop”|wc -l




[b]//统计首页抓取的次数占总体抓取次数比率[/b]cat baidu.log |awk '{print $4}'|awk '{if($0=="/"){n=n+1}}END{print n/NR*100"%"}'



[b]//统计404响应码占总响应码比率[/b]cat baidu.log |awk '{print $10}'|awk '{if($0=="404"){n=n+1}}END{print n/NR*100"%"}'


[b]//计算百度抓取总时间与总抓取次数[/b]cat baidu.log|awk '{FS=" "} {print $2}'|awk -F":" '{print $2}'| sort |uniq -c|awk 'BEGIN{print "小时","次数"} {print $2,$1}'|awk '{for(n=0;n<5;n++){b=$2}} {a+=b} {print $0}END{print "总数"b,a}’




[b]/计算百度抓取总字节数[/b]cat baidu.log |awk '{print $11}'|awk 'BEGIN{total=0}{total+=$1}END{print total}'




[b]//计算平均每次每个网页抓取字节数(小数点后面大于5进1)[/b]




看完了,没错,就是到这边,你没看错,你很认真。。。。。。。。。[b] 在此感谢ITSEO基友们,老狼在此学到了不少东西。。。。[/b]
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: