正则表达式 “双向最小匹配”
2015-10-06 20:23
190 查看
最近做一个 字符串查找的例子从字符串中提取制定内容
如下:
需要提取 "authentication.html?file=KF619L_Z.pdf"
代码 如下:
中间加了 ? 目的是 非贪婪匹配。
但是效果并不理想,效果如下:
按照最小匹配原则,原则上我们应该得到理想结果,但是却没有。
这是因为在正则的解释器中,对于最小匹配原则的理解为正向最小匹配,
而不是双向最小匹配。
左侧匹配后 定住左侧边界 直到找到右侧为止
我们换个思路:
中间包含在我们左侧的字符即可,
我们对代码进行改进:
得到了我们想要的结果:
补充:
【零宽断言】
正则表达四一些字符可以匹配一句话的开始、结束(^ $)或者匹配一个单词的开始、结束(\b)。这些元字符只匹配一个位置,指定这个位置满足一定的条件,而不是匹配某些字符,因此,它们被成为 零宽断言。所谓零宽,指的是它们不与任何字符相匹配,而匹配一个位置;所谓断言,指的是一个判断。正则表达式中只有当断言为真时才会继续进行匹配。
在有些时候,我们精确的匹配一个位置,而不仅仅是句子或者单词,这就需要我们自己写出断言来进行匹配。下面是断言的语法:
更多参考:http://www.cnblogs.com/youring2/archive/2009/11/07/1597786.html
如下:
String input = " <a href=\" <a href=\"authentication.html?file=KF619L_Z.pdf\" class=\"icondrawing balloonbtn\"
rel=\"shadowbox;width=720\">外観図面</a>";
需要提取 "authentication.html?file=KF619L_Z.pdf"
代码 如下:
using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.Text.RegularExpressions; using System.Threading.Tasks; namespace regDemo { class Program { static void Main(string[] args) { String input = " <a href=\" <a href=\"authentication.html?file=KF619L_Z.pdf\" class=\"icondrawing balloonbtn\" rel=\"shadowbox;width=720\">外観図面</a>"; Console.WriteLine(getCenterString(input, "href=\"", "\" class=")); Console.ReadKey(); } public static String getCenterString(String input,String left,String right) { Match match = Regex.Match(input, left + "(.+?)" + right); while (match.Success) { return match.Groups[1].Value; } return ""; } } }
中间加了 ? 目的是 非贪婪匹配。
但是效果并不理想,效果如下:
按照最小匹配原则,原则上我们应该得到理想结果,但是却没有。
这是因为在正则的解释器中,对于最小匹配原则的理解为正向最小匹配,
而不是双向最小匹配。
左侧匹配后 定住左侧边界 直到找到右侧为止
我们换个思路:
中间包含在我们左侧的字符即可,
我们对代码进行改进:
Match match = Regex.Match(input, left + "(((?!" + left + ").)+?)" + right);
得到了我们想要的结果:
补充:
【零宽断言】
正则表达四一些字符可以匹配一句话的开始、结束(^ $)或者匹配一个单词的开始、结束(\b)。这些元字符只匹配一个位置,指定这个位置满足一定的条件,而不是匹配某些字符,因此,它们被成为 零宽断言。所谓零宽,指的是它们不与任何字符相匹配,而匹配一个位置;所谓断言,指的是一个判断。正则表达式中只有当断言为真时才会继续进行匹配。
在有些时候,我们精确的匹配一个位置,而不仅仅是句子或者单词,这就需要我们自己写出断言来进行匹配。下面是断言的语法:
断言语法 | 说明 |
(?=pattern) | 前向肯定断言,匹配pattern前面的位置 |
(?!pattern) | 前向否定断言,匹配后面不是pattern的位置 |
(?<=pattern) | 后向肯定断言,匹配pattern后面的位置 |
(?<!pattern) | 后向否定断言,匹配前面不是pattern的位置 |
相关文章推荐
- IOS开发UI进阶之UITableView四
- C++链式栈
- JAVA语法基础 动手动脑及课后作业
- 剑指offer:翻转单词顺序列
- 解决LINK : fatal error LNK1140: 用于程序数据库的模块太多;链接时使用 /PDB:NONE 的错误
- 用图形界面实现两个数的加减乘除
- RecyclerView学习和使用(基本使用)
- 消息队列的使用场景
- Java多线程面试问题集锦(转)
- jquery实现checkbox全选反选
- Maven 学习-入门
- Java基础知识强化之集合框架笔记44:Set集合之TreeSet保证元素唯一性和自然排序的原理和图解
- Strings and Regular Expressions(homework for 02)
- AndroidStudio 中引用so文件并使用
- leetcode:Merge Two Sorted Lists(有序链表的归并)
- linux中cat、more、less、tail、head命令的区别
- Strassen矩阵乘法
- 4.19**
- FZU2203--比赛--10.1训练赛
- FZU Problem F 单纵大法好 (贪心,set容器) *