您的位置:首页 > 运维架构 > Linux

用Linux命令统计文件内容

2013-02-04 13:31 267 查看
近来用Cygwin中的Linux命令解决了很多Windows平台下的日常问题。比如下面要讨论的一个简单问题:统计文件中包含某段文件的行有多少。

1用Grep命令解决

grep "getPosPrice" 13_tp.log |cut -d "," -f 3 | grep"\"processState\":\"0\"" | wc -l

cut命令简介:

cut -d "," -f 3 13_tp.log

-d:按分隔符切割

-f:取第几列

2用Sed过滤行

Sed的强大在过滤行时体现的还不是很明显,在对行进行删除、替换、追加等操作时,Sed的优势体会的淋漓尽致。下面转载下另一篇文章中的例子,来一窥Sed强大之处。

举例:(假设我们有一文件名为ab)

删除某行

[root@localhost ruby] # sed'1d' ab #删除第一行

[root@localhost ruby] # sed'$d' ab #删除最后一行

[root@localhost ruby] # sed'1,2d' ab #删除第一行到第二行

[root@localhost ruby] # sed'2,$d' ab #删除第二行到最后一行

  显示某行

. [root@localhost ruby] # sed -n '1p' ab #显示第一行

[root@localhost ruby] # sed -n'$p' ab #显示最后一行

[root@localhost ruby] # sed -n'1,2p' ab #显示第一行到第二行

[root@localhost ruby] # sed -n'2,$p' ab #显示第二行到最后一行

  使用模式进行查询

[root@localhost ruby] # sed -n'/ruby/p' ab #查询包括关键字ruby所在所有行

[root@localhost ruby] # sed -n'/\$/p' ab #查询包括关键字$所在所有行,使用反斜线\屏蔽特殊含义

  增加一行或多行字符串

[root@localhost ruby]# cat ab

Hello!

ruby is me,welcome to my blog.

end

[root@localhost ruby] # sed '1adrink tea' ab #第一行后增加字符串"drinktea"

Hello!

drink tea

ruby is me,welcome to my blog.

end

[root@localhost ruby] # sed'1,3a drink tea' ab #第一行到第三行后增加字符串"drink tea"

Hello!

drink tea

ruby is me,welcome to my blog.

drink tea

end

drink tea

[root@localhost ruby] # sed '1adrink tea\nor coffee' ab #第一行后增加多行,使用换行符\n

Hello!

drink tea

or coffee

ruby is me,welcome to my blog.

end

  代替一行或多行

[root@localhost ruby] # sed '1cHi'ab #第一行代替为Hi

Hi

ruby is me,welcome to my blog.

end

[root@localhost ruby] # sed'1,2c Hi'ab #第一行到第二行代替为Hi

Hi

end

  替换一行中的某部分

  格式:sed 's/要替换的字符串/新的字符串/g' (要替换的字符串可以用正则表达式)

[root@localhost ruby] # sed -n'/ruby/p' ab | sed 's/ruby/bird/g' #替换ruby为bird

  [root@localhost ruby] # sed -n '/ruby/p'ab | sed 's/ruby//g' #删除ruby

插入

[root@localhost ruby] # sed -i'$a bye' ab #在文件ab中最后一行直接输入"bye"

[root@localhost ruby]# cat ab

Hello!

ruby is me,welcome to my blog.

end

bye

3强大的Awk

通过-f参数可以达到cut命令的效果

awk –F “,” ‘{print $3}’ 13_tp.log

上面对文件行的过滤也都可以由awk来完成,甚至可以统计出现某段文字的行与未出现行的比例等各种复杂需求。

awk -F ","'BEGIN{s0=0;s1=0}{if($1 ~ "getPosPrice")

{if($3=="\"processState\":\"0\""){s0++}else{s1++}}}END{prints0,s1}' 13_tp.log

格式化后的结构如下:

awk -F "," 'BEGIN { s0=0;s1=0 } {

if ($1 ~"getPosPrice") {

if ($3=="\"processState\":\"0\"") {

s0++

}

else {

s1++

}

}

} END { print s0,s1 }' 13_tp.log

参考资料

linux之sed用法

http://www.cnblogs.com/dong008259/archive/2011/12/07/2279897.html
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: