您的位置:首页 > 运维架构 > Shell

Apache日志分析(shell命令)

2013-05-22 09:08 169 查看



1,查看apache进程:
ps aux | grep httpd | grep -v grep | wc -l

2,查看80端口的tcp连接:
netstat -tan | grep "ESTABLISHED" | grep ":80" | wc -l

3,通过日志查看当天ip连接数,过滤重复:
cat access_log | grep "20/Oct/2008" | awk '{print $2}' | sort | uniq -c | sort -nr

4,当天ip连接数最高的ip都在干些什么(原来是蜘蛛):
cat access_log | grep "20/Oct/2008:00" | grep "122.102.7.212" | awk '{print $8}' | sort | uniq -c | sort -nr | head -n 10

5,当天访问页面排前10的url:
cat access_log | grep "20/Oct/2008:00" | awk '{print $8}' | sort | uniq -c | sort -nr | head -n 10

6,用tcpdump嗅探80端口的访问看看谁最高
tcpdump -i eth0 -tnn dst port 80 -c 1000 | awk -F"." '{print $1"."$2"."$3"."$4}' | sort | uniq -c | sort -nr<pre>接着从日志里查看该ip在干嘛:<pre lang="php">cat access_log | grep 122.102.7.212| awk '{print $1"\t"$8}' | sort | uniq -c | sort -nr | less

7,查看某一时间段的ip连接数:
grep "2006:0[7-8]" www20060723.log | awk '{print $2}' | sort | uniq -c| sort -nr | wc

来自http://www.yaoyingying.com/网。仅供学习

=====================

1、查看当天有多少个IP访问:

awk '{print $1}' log_file|sort|uniq|wc -l

2、查看某一个页面被访问的次数:

grep "/index.php" log_file | wc -l

3、查看每一个IP访问了多少个页面:

awk '{++S[$1]} END {for (a in S) print a,S[a]}' log_file

4、将每个IP访问的页面数进行从小到大排序:

awk '{++S[$1]} END {for (a in S) print S[a],a}' log_file | sort -n

5、查看某一个IP访问了哪些页面:

grep ^111.111.111.111 log_file| awk '{print $1,$7}'

6、去掉搜索引擎统计当天的页面:

awk '{print $12,$1}' log_file | grep ^\"Mozilla | awk '{print $2}' |sort | uniq | wc -l

7、查看2009年6月21日14时这一个小时内有多少IP访问:

awk '{print $4,$1}' log_file | grep 21/Jun/2009:14 | awk '{print $2}'| sort | uniq |

格式字符串描述
%%
百分号(Apache2.0.44或更高的版本)
%a
远端IP地址
%A
本机IP地址
%B
除HTTP头以外传送的字节数
%b
以CLF格式显示的除HTTP头以外传送的字节数,也就是当没有字节传送时显示’
-
‘而不是0。
%{Foobar}C
在请求中传送给服务端的cookieFoobar的内容。
%D
服务器处理本请求所用时间,以微为单位。
%{FOOBAR}e
环境变量FOOBAR的值
%f
文件名
%h
远端主机
%H
请求使用的协议
%{Foobar}i
发送到服务器的请求头
Foobar:
的内容。
%l
远端登录名(由identd而来,如果支持的话),除非
IdentityCheck
设为”
On
“,否则将得到一个”-”。
%m
请求的方法
%{Foobar}n
来自另一个模块的注解
Foobar
的内容。
%{Foobar}o
应答头
Foobar:
的内容。
%p
服务器服务于该请求的标准端口。
%P
为本请求提供服务的子进程的PID。
%{format}P
服务于该请求的PID或TID(线程ID),
format
的取值范围为:
pid
tid
(2.0.46及以后版本)以及
hextid
(需要APR1.2.0及以上版本)
%q
查询字符串(若存在则由一个”
?
“引导,否则返回空串)
%r
请求的第一行
%s
状态。对于内部重定向的请求,这个状态指的是原始请求的状态,—
%>s
则指的是最后请求的状态。
%t
时间,用普通日志时间格式(标准英语格式)
%{format}t
时间,用
strftime(3)
指定的格式表示的时间。(默认情况下按本地化格式)
%T
处理完请求所花时间,以秒为单位。
%u
远程用户名(根据验证信息而来;如果返回status(
%s
)为401,可能是假的)
%U
请求的URL路径,不包含查询字符串。
%v
对该请求提供服务的标准
ServerName
%V
根据
UseCanonicalName
指令设定的服务器名称。
%X
请求完成时的连接状态:
X
=
连接在应答完成前中断。
+
=
应答传送完后继续保持连接。
-
=
应答传送完后关闭连接。
(在1.3以后的版本中,这个指令是
%c
,但这样就和过去的SSL语法:
%{var}c
冲突了)
%I
接收的字节数,包括请求头的数据,并且不能为零。要使用这个指令你必须启用
mod_logio
模块。
%O
发送的字节数,包括请求头的数据,并且不能为零。要使用这个指令你必须启用
mod_logio
模块。
http://www.huanxiangwu.com/517/apache-log-analysis-of-shell-phrase
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: