您的位置:首页 > 编程语言 > C#

C#正则表达式——中文/英文空格(全角/半角空格)处理

2012-01-30 05:57 597 查看
1. 匹配中文(全角)空格

Regex.IsMatch(" ", "\u3000");\u3000是全角空格的16进制Unicode编码。



2. 匹配英文(半角)空格

Regex.IsMatch(" ", "\u0020")\u0020是半角空格的16进制Unicode编码。



3. 去除中文字符之间的英文(半角)空格

string text = "<p> 测 试 test1. 一下</p>";

var result = Regex.Replace(text, "(?<=[\u4e00-\u9fa5])(\u0020)(?=[\u4e00-\u9fa5])", string.Empty);Console.WriteLine(result);

//结果是:<p> 测试 test1. 一下</p>

(?=[\u4e00-\u9fa5]) 表示“正向预搜索”一个中文字符,判断\u0020的右侧是否为中文字符。

(?<=[\u4e00-\u9fa5]) 表示“反向预搜索”一个中文字符,判断\u0020的左侧是否为中文字符。



4. 在中文字符与英文字符之间增加空格

string text = "<p> test测试test1. 一hello下</p>";

text = Regex.Replace(text, @"(?<=[\u4e00-\u9fa5])([a-zA-Z])(?=[a-zA-Z])", " $1");text = Regex.Replace(text, @"(?<=[a-zA-Z])([a-zA-Z])(?=[\u4e00-\u9fa5])", "$1 ");

Console.WriteLine(text);

//输出结果:<p> test 测试 test1. 一 hello 下</p>



第一个正则表达式是针对“左中文,右英文”的情况。

第二个正则表达式是针对“左英文,右中文”的情况。



原帖地址:http://www.cnblogs.com/dudu/archive/2011/09/17/2179423.html
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: