C语言中使用正则表达式
2013-04-10 15:19
197 查看
C语言中使用正则表达式一般分为三步:
编译正则表达式 regcomp()匹配正则表达式 regexec()
释放正则表达式 regfree()
1、int regcomp (regex_t *compiled, const char *pattern, int cflags)
把指定的正则表达式pattern编译成一种特定的数据格式compiled,这样可以使匹配更有效。函数regexec 会使用这个数据在目标文本串中进行模式匹配。执行成功返回0。
参数说明:
(1)regex_t是一个结构提数据类型,用来存放编译后的正则表达式,它的成员re_nsub用来存储正则表达式中的子正则表达式的个数,子正则表达式就是用园括号包起来的部分表达式。
(2)pattern是指向我们写好的正则表达式的指针。
(3)cflags有如下4个值或者是他们 或运算(|)后的值:
REG_EXTENDED 以功能更加强大的扩展正则表达式的方式进行匹配。
REG_ICASE 匹配字母时忽略大小写
REG_NOSUB 不用存储匹配后的结果
REG_NEWLINE 识别换行符,这样'$'就可以从行尾开始匹配,'^'就可以从行的开头开始匹配。
2. int regexec (regex_t *compiled, char *string, size_t nmatch, regmatch_t matchptr [], int eflags)
当我们编译好正则表达式后,就可以用regexec 匹配我们的目标文本串了,如果在编译正则表达式的时候没有指定cflags的参数为REG_NEWLINE,则默认情况下是忽略换行符的,也就是把整个文本串当作一个字符串处理。执行成功返回0。
regmatch_t 是一个结构体数据类型,在regex.h中定义:
typedef struct
{
regoff_t rm_so;
regoff_t rm_eo;
} regmatch_t;
成员rm_so 存放匹配文本串在目标串中的开始位置,rm_eo 存放结束位置。通常我们以数组的形式定义一组这样的结构。因为往往我们的正则表达式中还包含子正则表达式。数组0单元存放主正则表达式位置,后边的单元依次存放子正则表达式位置。
参数说明:
①compiled 是已经用regcomp函数编译好的正则表达式。
②string 是目标文本串。
③nmatch 是regmatch_t结构体数组的长度。
④matchptr regmatch_t类型的结构体数组,存放匹配文本串的位置信息。
⑤eflags 有两个值
REG_NOTBOL 按我的理解是如果指定了这个值,那么'^'就不会从我们的目标串开始匹配。总之我到现在还不是很明白这个参数的意义;
REG_NOTEOL 和上边那个作用差不多,不过这个指定结束end of line。
相关文章推荐
- swift语言使用正则表达式验证字符串是否为邮箱,手机号,身份证号
- Go语言中正则表达式的使用
- AIX下AWK语言中使用正则表达式
- 【语言处理与Python】3.4使用正则表达式检测词组搭配
- 在C/C++语言中使用正则表达式
- java语言基础(60)——java正则表达式基础使用
- [每天一个知识点]10-Java语言-正则表达式使用
- 不同语言正则表达式使用小例
- Go语言:正则表达式的使用
- 在C/C++语言中使用正则表达式
- 在C/C++语言中使用正则表达式
- 4种使用javascript正则表达式进行字符串replace操作的方法
- VS2010中使用正则表达式替换时无法使用回车符的解决方法
- c#使用正则表达式替换html标签
- VC正则表达式的使用
- ***PHP preg_match正则表达式的使用
- PHP 正则表达式的几则使用技巧
- 使用MFC编写正则表达式
- 正则学习之一:在js中使用正则表达式
- ue中使用正则表达式来替换-正则表达式-的捕获组与非捕获组