您的位置：首页 > 编程语言 > C#

C# 正则表达式示例

2007-09-08 14:23 399 查看

正则表达式是用来解析字符串的.而解析字符串不外乎是达到下面几种目的

1.验证某一长串字符串中是否有符合某个条件的子字符串

2.从长字符串中提取符合某个条件的子字符串

3.把符合条件的子字符串替换成另外的字符串

4.把一个字符串分割成几个小字符串

正则表达式的复杂主要是体现在怎么指定那个"条件".其实实现上面说的4个目的大部分时候用string类的一些函数也照样能实现.只不过有时太复杂了点

下面举几个简单的例子说下怎么实现上面的4个目的.使用正则表达式时要引用命名空间using System.Text.RegularExpressions;

1.验证字符

假如有字符串string str = "I am arwen";我们想验证下这个字符串里是否包含字符"wen".

用正则表达式: bool exist = Regex.IsMatch(str, "wen");

用string类的函数:bool exist = str.Contains("wen");

2.提取字符

假如有字符串string str ="ahttpp://www.baidu.com/s?tn=sitehao12";我们想把字符www.baidu.com提取出来

用正则表达式:string subStr = Regex.Match(str, @"w{3}\..*\.com").Value;

用string类的函数:

int start = str.IndexOf("w");

int end = str.IndexOf("m");

string subStr = str.Substring(start, end - start + 1);

随着问题的复杂我们发现string类的函数就有点力不从心了.假如是随便给一段未知的字符串,然后要求提取出一个网址来.用string类函数实现起来很复杂而且容易出错

而用上面那句简单的正则表达式就能正确的提取.

3.替换字符

还是和上面类似的例子,假如随便给一段字符串,把里面的网址替换成www.csdn.net

假设还是字符串string str ="ahttpp://www.baidu.com/s?tn=sitehao12";

用正则表达式.

string newStr = Regex.Replace(str, @"w{3}\..*\.com", "wwww.csdn.net");

这个用string的函数实现起来就更麻烦了啊.这里就不用它来实现了.反正思路就是要先搜索出字符串里的网址,再把它替换成www.csdn.net

4.分割字符

假如有字符string str = "http:ww/w.baidu.com";要以: / .这样的符号为分割符,把字符分割成只包含字母的子字符串

用正则表达式:

string[] strs = Regex.Split(str, @"[:/\.]");

用string类的函数

string[] strs = str.Split(new char[] { ':', '/', '.' });

在上面的例子中我们会看到@"w{3}\..*\.com" 和@"[:/\.]这样奇怪的字符串,我们一般把它们叫作模式(pattern),也就是说通过它来指明要符合某个条件.在正则表达式的应用中最难的地方就是怎么通过它们来指定条件.其中的符号都有特殊的含义.

示例大全：

匹配中文字符的正则表达式： [u4e00-u9fa5]

　　评注：匹配中文还真是个头疼的事，有了这个表达式就好办了

　　匹配双字节字符(包括汉字在内)：[^x00-xff]

　　评注：可以用来计算字符串的长度（一个双字节字符长度计2，ASCII字符计1）

　　匹配空白行的正则表达式：ns*r

　　评注：可以用来删除空白行

　　匹配HTML标记的正则表达式：<(S*?)[^>]*>.*?|<.*? />

　　评注：网上流传的版本太糟糕，上面这个也仅仅能匹配部分，对于复杂的嵌套标记依旧无能为力

　　匹配首尾空白字符的正则表达式：^s*|s*$

　　评注：可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等)，非常有用的表达式

　　匹配Email地址的正则表达式：w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*

　　评注：表单验证时很实用

　　匹配网址URL的正则表达式：[a-zA-z]+://[^s]*

　　评注：网上流传的版本功能很有限，上面这个基本可以满足需求

　　匹配帐号是否合法(字母开头，允许5-16字节，允许字母数字下划线)：^[a-zA-Z][a-zA-Z0-9_]{4,15}$

　　评注：表单验证时很实用

　　匹配国内电话号码：d{3}-d{8}|d{4}-d{7}

　　评注：匹配形式如 0511-4405222 或 021-87888822

　　匹配腾讯QQ号：[1-9][0-9]{4,}

　　评注：腾讯QQ号从10000开始

　　匹配中国邮政编码：[1-9]d{5}(?!d)

　　评注：中国邮政编码为6位数字

　　匹配身份证：d{15}|d{18}

　　评注：中国的身份证为15位或18位

　　匹配ip地址：d+.d+.d+.d+

　　评注：提取ip地址时有用

　　匹配特定数字：

　　^[1-9]d*$　　 //匹配正整数

　　^-[1-9]d*$ 　 //匹配负整数

　　^-?[1-9]d*$　　 //匹配整数

　　^[1-9]d*|0$　 //匹配非负整数（正整数 + 0）

　　^-[1-9]d*|0$　　 //匹配非正整数（负整数 + 0）

　　^[1-9]d*.d*|0.d*[1-9]d*$　　 //匹配正浮点数

　　^-([1-9]d*.d*|0.d*[1-9]d*)$　 //匹配负浮点数

　　^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$　 //匹配浮点数

　　^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$　　 //匹配非负浮点数（正浮点数 + 0）

　　^(-([1-9]d*.d*|0.d*[1-9]d*))|0?.0+|0$　　//匹配非正浮点数（负浮点数 + 0）

　　评注：处理大量数据时有用，具体应用时注意修正

　　匹配特定字符串：

　　^[A-Za-z]+$　　//匹配由26个英文字母组成的字符串

　　^[A-Z]+$　　//匹配由26个英文字母的大写组成的字符串

　　^[a-z]+$　　//匹配由26个英文字母的小写组成的字符串

　　^[A-Za-z0-9]+$　　//匹配由数字和26个英文字母组成的字符串

　　^w+$　　//匹配由数字、26个英文字母或者下划线组成的字符串

　　在使用RegularExpressionValidator验证控件时的验证功能及其验证表达式介绍如下:

　　只能输入数字：“^[0-9]*$”

　　只能输入n位的数字：“^d{n}$”

　　只能输入至少n位数字：“^d{n,}$”

　　只能输入m-n位的数字：“^d{m,n}$”

　　只能输入零和非零开头的数字：“^(0|[1-9][0-9]*)$”

　　只能输入有两位小数的正实数：“^[0-9]+(.[0-9]{2})?$”

　　只能输入有1-3位小数的正实数：“^[0-9]+(.[0-9]{1,3})?$”

　　只能输入非零的正整数：“^+?[1-9][0-9]*$”

　　只能输入非零的负整数：“^-[1-9][0-9]*$”

　　只能输入长度为3的字符：“^.{3}$”

　　只能输入由26个英文字母组成的字符串：“^[A-Za-z]+$”

　　只能输入由26个大写英文字母组成的字符串：“^[A-Z]+$”

　　只能输入由26个小写英文字母组成的字符串：“^[a-z]+$”

　　只能输入由数字和26个英文字母组成的字符串：“^[A-Za-z0-9]+$”

　　只能输入由数字、26个英文字母或者下划线组成的字符串：“^w+$”

　　验证用户密码:“^[a-zA-Z]w{5,17}$”正确格式为：以字母开头，长度在6-18之间，

　　只能包含字符、数字和下划线。

　　验证是否含有^%&'',;=?$"等字符：“[^%&'',;=?$x22]+”

　　只能输入汉字：“^[u4e00-u9fa5],{0,}$”

　　验证Email地址：“^w+[-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*$”

　　验证InternetURL：“^http://([w-]+.)+[w-]+(/[w-./?%&=]*)?$”

　　验证电话号码：“^((d{3,4})|d{3,4}-)?d{7,8}$”

　　正确格式为：“XXXX-XXXXXXX”，“XXXX-XXXXXXXX”，“XXX-XXXXXXX”，

　　“XXX-XXXXXXXX”，“XXXXXXX”，“XXXXXXXX”。

　　验证身份证号（15位或18位数字）：“^d{15}|d{}18$”

　　验证一年的12个月：“^(0?[1-9]|1[0-2])$”正确格式为：“01”-“09”和“1”“12”

　　验证一个月的31天：“^((0?[1-9])|((1|2)[0-9])|30|31)$”

　　正确格式为：“01”“09”和“1”“31”。

　　匹配中文字符的正则表达式： [u4e00-u9fa5]

　　匹配双字节字符(包括汉字在内)：[^x00-xff]

　　匹配空行的正则表达式：n[s| ]*r

　　匹配HTML标记的正则表达式：/<(.*)>.*|<(.*) />/

　　匹配首尾空格的正则表达式：(^s*)|(s*$)

　　匹配Email地址的正则表达式：w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*

　　匹配网址URL的正则表达式：http://([w-]+.)+[w-]+(/[w- ./?%&=]*)?

C# 正则表达式示例

1.验证字符

2.提取字符

3.替换字符

4.分割字符

示例大全：

参考资源

正则表达式中的限定符和元字符: http://blog.csdn.net/weiwenhp/article/details/7663219

更多示例参考：