您的位置:首页 > 其它

grep常见用法总结

2014-09-04 12:53 302 查看
grep -E 'l\{2,\}' 2.txt
grep -E 'h(ell|a)o' test.txt
grep '[a-z]\{5,\}' test.txt
grep -xf a.txt b.txt  //查询a与b共同存在的行
grep -vxf b.txt a.txt //查询a的行不在b文件里面的,就是a比b多出来的行

grep -v '^h' test.txt //显示非以h开发的

grep -E '^(h|y)' test.txt //-E支持扩展正则,相当于egrep

grep -A 1 'hello' test.txt  //除了显示匹配到的行也显示它之后的一行
grep -B 1 'hello' test.txt  //除了显示匹配到的行也显示它之前的一行
grep -C 1 'hello' test.txt  //除了显示匹配到的行也显示它之前和之后的一行

grep -r "hello" xx //在xx目录查找
grep -c //统计匹配的行数
grep -n //显示行号

grep -v '^hello' test.txt //显示不以hello开头的行
--很聪明的写法,第一位不以h开发,第二位不以e开发。。。
grep  '^[^h]\|^.[^e]\|^..[^l]\|^...[^l]\|^....[^o]'

[options]主要参数:
-c:只输出匹配行的计数。
-I:不区分大 小写(只适用于单字符)。
-h:查询多文件时不显示文件名。
-l:查询多文件时只输出包含匹配字符的文件名。
-n:显示匹配行及 行号。
-s:不显示不存在或无匹配文本的错误信息。
-v:显示不包含匹配文本的所有行。

命令正则表达式:

. 匹配单个字符 如..X  yiX能查出来
^ 匹配行首 ^d 每行第一个字符为d
$ 匹配行尾 T$ 每行最后一个字符为T
* 匹配任意字符串
\ 屏蔽特殊字符的含义
A\{2\}B 字母A出现两次
A\{2,\}B 至少出现两次
A\{2,4\}B 出现2到4次
[0-9]\{4\}xx[0-9]\{4\} 前四个是数字,中间是xx,后四个是数字

pattern正则表达式主要参数:
\: 忽略正则表达式中特殊字符的原有含义。
^:匹配正则表达式的开始行。
$: 匹配正则表达式的结束行。
\<:从匹配正则表达 式的行开始。
锚定单词的开始,如:/\<love/匹配包含以love开头的单词的行。
\>:到匹配正则表达式的行结束。
[ ]:单个字符,如[A]即A符合要求 。
[ - ]:范围,如[A-Z],即A、B、C一直到Z都符合要求 。
。:所有的单个字符。
* :有字符,长度可以为0
[^]
匹配一个不在指定范围内的字符,如:/[^A-RT-Z]ed/匹配不包含A-R和T-Z的一个字母开头,紧跟ed的行。

+
匹配前面的子表达式一次或多次。例如,'zo+' 能匹配 "zo" 以及 "zoo",但不能匹配 "z"。+ 等价于 {1,}。

?
匹配前面的子表达式零次或一次。例如,"do(es)?" 可以匹配 "do" 或 "does" 中的"do" 。? 等价于 {0,1}。

(?=pattern)
正向预查,在任何匹配 pattern 的字符串开始处匹配查找字符串。这是一个非获取匹配,也就是说,该匹配不需要获取供以后使用。
例如, 'Windows (?=95|98|NT|2000)' 能匹配 "Windows 2000" 中的 "Windows" ,但不能匹配 "Windows 3.1" 中的 "Windows"。预查不消耗字符,也就是说,在一个匹配发生后,在最后一次匹配之后立即开始下一次匹配的搜索,而不是从包含预查的字符之后开始。

(?!pattern)
负向预查,在任何不匹配Negative lookahead matches the search string at any point where a string not matching pattern 的字符串开始处匹配查找字符串。这是一个非获取匹配,也就是说,该匹配不需要获取供以后使用。例如'Windows (?!95|98|NT|2000)' 能匹配 "Windows 3.1" 中的 "Windows",但不能匹配 "Windows 2000" 中的 "Windows"。预查不消耗字符,也就是说,在一个匹配发生后,在最后一次匹配之后立即开始下一次匹配的搜索,而不是从包含预查的字符之后开始

(?:pattern)
匹配 pattern 但不获取匹配结果,也就是说这是一个非获取匹配,不进行存储供以后使用。这在使用 "或" 字符 (|) 来组合一个模式的各个部分是很有用。
例如, 'industr(?:y|ies) 就是一个比 'industry|industries' 更简略的表达式

pcregrep 'Windows (?=2000|95|98|NT)' test.txt //Windows后面是2000或95..
pcregrep 'Windows (?!2000|95|98|NT)' test.txt  //Windows后面非2000,95,98等
pcregrep 'Windows (?:95|98|NT|2000)' test.txt  //与第一种一样

egrep:
为 grep 的扩充版本, 改良了许多传统 grep 不能或不便的操作. 比方说:
- grep 之下不支持 ? 与 + 这两种 modifier, 但 egrep 则可.
- grep 不支持 a|b 或 (abc|xyz) 这类"或一"比对, 但 egrep 则可.

fgrep:
不作 RE 处理, 表达式仅作一般字符串处理, 所有 meta 均失去功能.

pcregrep:
pcregrep - a grep with Perl-compatible regular expressions , perl正则,是最流行和规范的
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: