一行代码了解网站被访问最多的URL
2016-09-15 23:42
387 查看
转自:http://sesame.iteye.com/blog/1678326
有需求想分析下网站的被访问的TOP 10 URL是哪些,想到了apache 的cookie日志中有记录,在日志目录的cookie_log.*文件中,打开一个确实存在:
Log代码
112.113.241.58 - - - [09/Sep/2012:00:01:08 +0800] "GET /dd.abc.com/favicon.ico HTTP/1.1" 200 1406 154 "-" "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1) QQBrowser/6.0"
不过对每一个列对应的含义不是很清楚,看了下httpd.conf,
Html代码
LogFormat "%h %l %u %t \"%r\" %>s %b \"%{Referer}i\" \"%{User-Agent}i\"" combined
LogFormat "%h %l %u %t \"%r\" %>s %b" common
查了下apache的配置文档,了解了对应的含义。
写了一行shell脚本:
Shell代码
cat cookie_log.0 | awk '{ print $8 }' | sed s/?.*//g |sort | uniq -c | sort -n -r |head -n 10
(uniq这个命令默认只删除紧挨的重复行,所以需要先sort下,再uniq)
得到以下结果,(具体网址用手动替换成*了)
结果代码
2713 /172.22.14.109/ok.htm
2387 /*/order/orderList.htm
1009 /*/favicon.ico
990 /*/index.htm
854 /*/wide/jhs/wlTrace.htm
851 /*/aita/css/aita-main.css
780 /*/order/orderDetail.htm
715 /*/storage/stockInList.json
519 /*/determine/deduce.json
496 /*/order/channelOrderListLimit.json
有需求想分析下网站的被访问的TOP 10 URL是哪些,想到了apache 的cookie日志中有记录,在日志目录的cookie_log.*文件中,打开一个确实存在:
Log代码
112.113.241.58 - - - [09/Sep/2012:00:01:08 +0800] "GET /dd.abc.com/favicon.ico HTTP/1.1" 200 1406 154 "-" "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1) QQBrowser/6.0"
不过对每一个列对应的含义不是很清楚,看了下httpd.conf,
Html代码
LogFormat "%h %l %u %t \"%r\" %>s %b \"%{Referer}i\" \"%{User-Agent}i\"" combined
LogFormat "%h %l %u %t \"%r\" %>s %b" common
查了下apache的配置文档,了解了对应的含义。
写了一行shell脚本:
Shell代码
cat cookie_log.0 | awk '{ print $8 }' | sed s/?.*//g |sort | uniq -c | sort -n -r |head -n 10
(uniq这个命令默认只删除紧挨的重复行,所以需要先sort下,再uniq)
得到以下结果,(具体网址用手动替换成*了)
结果代码
2713 /172.22.14.109/ok.htm
2387 /*/order/orderList.htm
1009 /*/favicon.ico
990 /*/index.htm
854 /*/wide/jhs/wlTrace.htm
851 /*/aita/css/aita-main.css
780 /*/order/orderDetail.htm
715 /*/storage/stockInList.json
519 /*/determine/deduce.json
496 /*/order/channelOrderListLimit.json
相关文章推荐
- 了解 .NET Framework 2.0 中“代码访问安全性”(CAS) 的新特点
- FormatRemoteUrl函数之asp实现格式化成当前网站完整的URL-将相对地址转换为绝对地址的代码
- 了解对手的大致流量 六款查询访问数据的网站
- JS网站访问人数统计代码
- 网站在线人数以及历史访问人数的统计代码
- 国外网站封闭中国的ip访问的代码
- 初步了解URL如何访问模块操作
- 修改MOSS网站的URL访问地址
- 在CSS文件的最前面加上一行代码将网站变成黑白色
- asp.net C# 直接读取或访问其它网站的URL示例
- FormatRemoteUrl函数之asp实现格式化成当前网站完整的URL-将相对地址转换为绝对地址的代码
- 获取网站访问来源URL
- 网站在线人数以及历史访问人数的统计代码
- 用进程跟踪来了解网站的访问情况
- 网站变黑白色CSS一行代码实现
- 通过request对象获取访问网站用户的 IP 访问者的浏览器名 操作系统名 从哪里转过来 以及 Url 上的所有参数
- 下载指定代理文件调用IE使用代理访问指定网站的代码
- 网站变黑白色CSS一行代码实现
- java HttpURLConnection 登录网站 完整代码
- asp.net C# 直接读取或访问其它网站的URL示例