您的位置:首页 > 运维架构 > Shell

shell编程-正则表达式

2016-06-29 13:30 459 查看

1、正则表达式是什么

正则表达式是用于字符排列和匹配模式的一种语法规则。它主要用于字符串的模式分割、匹配、查找及替换操作。

2、正则表达式与通配符

正则表达式用来在文件中匹配符合条件的字符串,正则是包含匹配。grep、awk、sed等命令可以支持正则表达式。

通配符用来匹配符合条件的文件名,通配符是完全匹配。ls、find、cp这些命令不支持正则表达式,所以只能使用shell自己的通配符进行匹配了。

通配符:

*:匹配任意内容

?: 匹配任意一个内容

[]:匹配中括号中的一个字符

3、基础正则表达式

元字符作用
*前一个字符匹配0次或任意多次。
.匹配除了换行符外任意一个字符。
^匹配行首。例如^hello会匹配以hello开头的行。
$匹配行尾。例如hello$会匹配以hello结尾的行。
[]匹配中括号中指定的任意一个字符,只匹配一个字符。例如[aoeiu]匹配任意一个元音字符,[0-9]匹配任意一个数字,[a-z][0-9]匹配小写字和一位数字构成的两位字符
[^]匹配除中括号的字符以外的任意一个字符。例如:[^0-9]匹配任意一位非数字字符,[^a-z]表示任意一位非小写字母。
\转义符。用于取消讲特殊符号的含义取消。
\{n,\}表示其前面的字符恰好出现n次。例如[0-9]\{4\}匹配4位数字,
\{n,m\}表示前面的字符至少出现一次,最多出现m次。例如[a-z]\{6,8}匹配6到8位的小写字母。
补充:

?()属于扩展正则

修改~/.bashrc配置文件,为grep起别名,将匹配出来的用颜色显示alias grep=’grep –color=auto’

例如:*号的示例

[root@localhost home]# grep aa* test.txt
a
aa
aaa
aaaa
aaaaa
ab
aabb


例如

“.”:匹配除了换行符外任意一个字符

“s..d”:会匹配在s和d这两个字母之间一定有两个字符的单词

[root@localhost home]# grep "s..d" test.txt
said
soid
sdkdkdkd


“s.*d”:匹配在s和d字母之间有任意字符

[root@localhost home]# grep "s.*d" test.txt
said
soid
sdkdkdkd


“.*”:匹配所有内容

[root@localhost home]# grep ".*" test.txt
a
aa
aaa
aaaa
aaaaa

ab
aabb

b
bb
bbb
bbbb
bbbb

said
soid
sdkdkdkd


例如

“^”匹配行首,”$”匹配行尾

“^M”:匹配以大写“M”开头的行

[root@localhost home]# grep "^a" test.txt
a
aa
aaa
aaaa
aaaaa
ab
aabb


“n$”:匹配以小写“n”结尾的行

[root@localhost home]# grep "b$" test.txt
ab
aabb
b
bb
bbb
bbbb
bbbb


“^$”:匹配空白行显示,增加-n选项,显示行号

[root@localhost home]# grep -n "^$" test.txt
6:
9:
15:
16:


例如

“[]” : 匹配中括号中指定的任意一个字符,只匹配一个字符。

“s[ao]id”:匹配s和i字母中间,要么是a,要么是o的字符串

[root@localhost home]# grep -n "s[ao]id" test.txt
17:said
18:soid


“[0-9]”:匹配包括任意一个数字的行

[root@localhost home]# grep -n "[0-9]" test.txt
22:6adfadfadf8
23:jladf8002378
25:ladfjadf7
27:3333333333
29:2222222222


“^[a-z]”:匹配用小写字母开头的行

[root@localhost home]# grep "^[a-z]" test.txt
a
aa
aaa
aaaa
aaaaa
ab
aabb
b
bb
bbb
bbbb
bbbb
said
soid
sdkdkdkd
jladf8002378
ladfjadf7


“[a-z]$”:匹配用小写字母结尾的行

[root@localhost home]# grep "[a-z]$" test.txt
a
aa
aaa
aaaa
aaaaa
ab
aabb
b
bb
bbb
bbbb
bbbb
said
soid
sdkdkdkd

[root@localhost home]# grep "^[a-z]$" test.txt
a
b
[root@localhost home]# grep "^[a-z][a-z]$" test.txt
aa
ab
bb


“[^]”:匹配除中括号的字符以外的任意字符。(说明:^放在中括号内)

“^[^a-z]”:匹配不用小写字母开头的行

[root@localhost home]# grep "^[^a-z]" test.txt
6adfadfadf8
3333333333
2222222222


“^[^a-zA-Z]”:匹配不用字母开头的行

[root@localhost home]# grep "^[^a-zA-Z]" test.txt
6adfadfadf8
3333333333
2222222222


“\”:转义字符,作用让特殊的字符丧失意义

“.$”:匹配使用”.”结尾的行

[root@localhost home]# grep "\.$" test.txt
6adfadfadf8.


“\{n\}”:表示其前面的字符恰好出现n次

“a\{3\}”:匹配a字母连续出现三次的字符串。

注意:至少重复3次,匹配出来的结果显示超过3个字符串也会显示到结果中

[root@localhost home]# grep "a\{3\}" test.txt
aaa
aaaa
aaaaa


“[0-9]\{3\}”:匹配包括连续的三个数字的字符串

要想准确查找,需要加定界符
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: