您的位置：首页 > 其它

grep 正则表达式及选项以及注意

2012-04-26 17:53 393 查看

说明：在原文基础上稍作了修改
grep命令简介：在ex编辑器（我没用过）中，启动ex编辑器后要查找某个字符串时，在ex的命令提示符后键入::/pattern/p
:/g/pattern/pgrep这个名字就由来如此。其中p的含义是print，而当g出现在pattern前面的时候，其含义是“文件中所有行”，或“执行全局替换”。被查找的模式称作正则表达式(regular expression)因此，把pattern换成RE，于是就成了g/RE/p,grep。grep命令语法：前面的名字由来部分已经明确告诉我们，grep的作用是在一个或多个文件中查找茉个字符模式。egrep和fgrep都只是grep的变体，这里我们不做介绍。看一下grep的语法结构。
#include <stdlib.h>
#include <unistd.h>
#include <string.h>
#include <sys/wait.h>
int main(int argc, char *argv[])
{
int pfd[2];
pid_t cpid;
char buf;
if(argc != 2)
{
fprintf(stderr,"Usage: %s <string>\n",argv[0]);
exit(0);
}
if (pipe(pfd) == -1)
{
perror("pipe");
exit(EXIT_FAILURE);
}
cpid = fork();
if (cpid == -1)
{
perror("fork");
exit(EXIT_FAILURE);
}
if (cpid == 0)
{
close(pfd[1]); /* Close unused write end */
while (read(pfd[0], &buf, 1) > 0)
write(STDOUT_FILENO, &buf, 1);
write(STDOUT_FILENO, "\n", 1);
close(pfd[0]);
exit(EXIT_SUCCESS);
}
else
{
close(pfd[0]); /* Close unused read end */
write(pfd[1], argv[1], strlen(argv[1]));
close(pfd[1]); /* Reader will see EOF */
wait(NULL); /* Wait for child */
exit(EXIT_SUCCESS);
}
}
#include <stdlib.h>
#include <unistd.h>
#include <string.h>
#include <sys/wait.h>
int main(int argc, char *argv[])
{
int pfd[2];
pid_t cpid;
char buf;
if(argc != 2)
{
fprintf(stderr,"Usage: %s <string>\n",argv[0]);
exit(0);
}
if (pipe(pfd) == -1)
{
perror("pipe");
exit(EXIT_FAILURE);
}
cpid = fork();
if (cpid == -1)
{
perror("fork");
exit(EXIT_FAILURE);
}
if (cpid == 0)
{
close(pfd[1]); /* Close unused write end */
while (read(pfd[0], &buf, 1) > 0)
write(STDOUT_FILENO, &buf, 1);
write(STDOUT_FILENO, "\n", 1);
close(pfd[0]);
exit(EXIT_SUCCESS);
}
else
{
close(pfd[0]); /* Close unused read end */
write(pfd[1], argv[1], strlen(argv[1]));
close(pfd[1]); /* Reader will see EOF */
wait(NULL); /* Wait for child */
exit(EXIT_SUCCESS);
}
}
grep使用的正则表达式元字符：正则表达式中的元字符，我之前在javascript的日志中详细介绍过。这里不再解释何为正则表达式，只让大家来看一下在grep中使用的正则表达式元字符。

元字符	功能	示例	匹配对象
^	行首定位符	‘^simaopig%’	匹配所有以simaopig开头的行
$	行尾定位符	‘simaopig$’	匹配所有以simaopig结尾的行
.	匹配任意一个字符	‘s.m’	匹配包含一个s字符，后面跟一个字符（随意），再跟一个m的行
*	匹配0或多个前一字符	‘s*m’	匹配包含零个或多个s字符，后面跟有一个m字符的行
[]	匹配一组字符中的任意一个	‘[Ss]imaopig’	匹配simaopig，或者Simaopig
[^]	匹配不在指定字符组内的字符	‘[^a-z]imaopig’	匹配不包含在a-z之间的字符后跟着imaopig的行，即所有aimaopig-zimaopig的行都不包含（有点绕）
\<	词首定位符	‘\<simaopig’	匹配以simaopig为开头的词的行，simaopigabcd也是可以的
\>	词尾定位符	‘simaopig\>’	匹配以simaopig为结尾的词的行，abcdsimaopig也是可以的
$..$	标记匹配的字符	‘$simaopig$'s blog’	标记寄存器里的一段字符，该寄存器被记作1号寄存器。以后引用这段字符时，可以使用\1来重复该模式。9个标签中最左边的是第一号。例如，模式simaopig被保存在1号寄存器里，之后用\1来引用它。
x\{m\}或x\{m,\}或x\{m,n\}	字符x的重复出现	‘s\{5\}’,'s\{5,\}’,'s\{5,10\}’	匹配连续出现5个s、至少5个s或5到10个s的行

grep的选项：观其语法结构，grep有着很丰富的选项。下面的表格中我会为大家介绍其常用的选项。

选项	功能
-b	在每一行前面加上其所在的块号，根据上下文定位磁盘块时可能会用到
-c	显示匹配到的行的数目，而不是显示行的内容
-h	不显示文件名
-i	比较字符时忽略大小写的区别
-l（小写的字母L）	只列出匹配行所在文件的文件名（每个文件名只列一次），文件名之间用换行符分隔
-n	在每一行前面加上它在文件中的相对行号
-s	无声操作，即只显示报错信息，用于检查退出状态
-v	反向查找，只显示不匹配的行
-w	把表达式作为词来查找，就好像它被\<和\>夹着那样。只适用于grep（并非所有版本的grep都支持这一功能，譬如，SCO UNIX就不支持）

grep简单示例：例如第一个表格中，我想查找所有带有if的行并且显示行号，如何查找呢？grep -n if a.html输出：

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航