您的位置:首页 > 编程语言 > C#

C#学习之正则表达式基础

2013-07-28 23:14 113 查看
概念、定义、介绍参考源码中注释部分。

新建控制台应用程序,源码如下:

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Text.RegularExpressions;

namespace _07使用正则表达式
{
class Program
{
static void Main(string[] args)
{
#region 概念、定义、介绍
//1、 .:匹配除\n之外的任何单个字符。例如正则表达式“b.g”能匹配如下字符串:“big”、“bug”、“b g”,但是不匹配“buug”,“b..g”可以匹配“buug”。
//2、[ ] :匹配括号中的任何一个字符。例如正则表达式“b[aui]g”匹配bug、big和bag,但是不匹配beg、baug。可以在括号中使用连字符“-”来指定字符的区间来简化表示,
//例如正则表达式[0-9]可以匹配任何数字字符,这样正则表达式“a[0-9]c”等价于“a[0123456789]c”就可以匹配“a0c”、“a1c”、“a2c”等字符串;还可以制定多个区间,
//例如“[A-Za-z]”可以匹配任何大小写字母,“[A-Za-z0-9]”可以匹配任何的大小写字母或者数字。
//3、| :将两个匹配条件进行逻辑“或”运算。‘z|food’ 能匹配 “z” 或 “food”。‘(z|f)ood’ 则匹配 “zood” 或 “food”。 //注意^$问题。
//4、( ) :将 () 之间括起来的表达式定义为“组”(group),并且将匹配这个表达式的字符保存到一个临时区域,这个元字符在字符串提取的时候非常有用。
//把一些字符表示为一个整体。改变优先级、定义提取组两个作用。
//5、*:匹配0至多个在它之前的子表达式,和通配符*没关系。例如正则表达式“zo*”(等同于z(o)*)能匹配 “z” 、“zo”以及 “zoo”;
//因此“.*”意味着能够匹配任意字符串。"z(b|c)*"→zb、zbc、zcb、zccc、zbbbccc。"z(ab)*"能匹配z、zab、zabab(用括号改变优先级)。

//6、+ :匹配前面的子表达式一次或多次,和*对比(0到多次)。例如正则表达式9+匹配9、99、999等。 “zo+”能匹配 “zo”以及 “zoo” ,不能匹配"z"。
//7、? :匹配前面的子表达式零次或一次。例如,“do(es)?” 可以匹配 “do” 或 “does” 。一般用来匹配“可选部分”。(终止贪婪模式)
//8、{n} :匹配确定的 n 次。“zo{2}”→zoo。例如,“e{2}” 不能匹配“bed”中的“e”,但是能匹配“seed”中的两个“e”。 //seeeed,不可以。
//9、{n,} :至少匹配n次。例如,“e{2,}”不能匹配“bed”中的“e”,但能匹配 “seeeeeeeed”中的所有“e”。
//10、{n,m} :最少匹配 n 次且最多匹配 m 次。“e{1,3}”将匹配“seeeeeeeed”中的前三个“e”。 {2,5}//bed,seed,seeed;beeeeed错误。限定符:限定前面的正则表达式出现的次数。
//11、^(shift+6) :匹配一行的开始。例如正则表达式“^regex”能够匹配字符串“regex我会用”的开始,但是不能匹配“我会用regex”。
//12、^另外一种意思:非!([^0-9])
//13、$ :匹配行结束符。例如正则表达式“浮云$” 能够匹配字符串“一切都是浮云”的末尾,但是不能匹配字符串“浮云呀”

//简写表达式
//1、\d:代表一个数字,等同于[0-9]   \\d  →\d
//2、\D:代表非数字,等同于[^0-9]
//3、\s:代表换行符、Tab制表符等空白字符 ,(空格、回车、制表符)
//4、\S:代表非空白字符(a0%$@@)
//5、\w:匹配字母或数字或下划线或汉字,即能组成单词的字符,除%&#@!$等字符。[a-zA-Z0-9_汉字]
//6、\W:非\w ,等同于[^\w] %

//在.net中使用正则表达式的时候就使用Regex这个类
//Regex.IsMatch();//判断一个字符串是否匹配某个正则表达式
//Regex.Match();//从某个字符串中提取匹配正则表达式的某个子字符串(只能提取一个)
//Regex.Matches();//
//Regex.Replace();//
#endregion

#region Regex.IsMatch()
string reg = "^a.+b$";
bool b = Regex.IsMatch("axxx.b", reg);
Console.WriteLine(b);

Console.WriteLine(Regex.IsMatch("bbbbg", "^b.*g$")); //yes
Console.WriteLine(Regex.IsMatch("bg", "^b.*g$")); //yes
Console.WriteLine(Regex.IsMatch("gege", "^b.*g$"));//No

string regexp = @"\d{6}";
string msg = "中关村软件园100094,哈哈厚黑!";
//这时,返回的结果是true,因为正则表达式中没有写开始(^)和结束($)   ^和$
//所以,IsMatch()方法在msg这个字符串中,只要找到任何一个与regexe匹配的字符串就返回true
Console.WriteLine(Regex.IsMatch(msg, regexp));//true

string regexp1 = @"^\d{6}$"; //这时才表示整个字符串必须与该正则表达式完全匹配
string msg1 = "中关村软件园100094,哈哈厚黑!";
Console.WriteLine(Regex.IsMatch(msg1, regexp1));//false,完全匹配

//string regexp = "^(z|food)$";
string regexp2 = "^z|food$";
while (true)
{
Console.WriteLine("请输入一个字符串:");
string msg2 = Console.ReadLine();

Console.WriteLine(Regex.IsMatch(msg2, regexp2));
}

//对比说明:
//1.^z|food$
//表示以z开头的任意字符串 或者 以 food结尾的任意字符串都返回true
//原因是:|的优先级最低。所以上边的表达式其实: (^z)|(food$)

//2.z|food
//表示 z 或者 food 不表示,zood,但是,由于该正则表达式没有写^ 和$ 。所以在整个字符串中,只要有任意一个位置出现z或者food都返回true

//3.^(z|f)ood$ 这个才表示要么是zood要么是food,只能匹配这两个。
//^zood$|^food$  ,与^z|food$不一样,^z|food$表示z.......或者......food
#endregion
}
}
}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: