正则表达式中最短匹配模式的用法浅析
2017-07-17 09:11
591 查看
前言
最近有一次想用正则表达式从网页里面抓取一些东西出来,内容不复杂却出现不少问题。下面话不多说,来一起看看详细的介绍:
当我们用正则表达式去匹配一个标签的首尾的时候,比如匹配
<h1>hello world</h1>中的 h1 的开始和闭合标签
可能很多人会这样写
/<.*h1>/g
但是这样真的可以吗?
因为 * 匹配符是匹配前面一个字符的零到多个,而且它是贪婪匹配的
所以你得到的就会是下面的结果了。
显然这并不是我们想要的,那么怎么把贪婪匹配换成最小匹配呢,
/<.*?h1>/g
上面的写法就可以了,如下图:
其实原理应该很简单,因为 ? 也是贪婪匹配,并且只能匹配0到1个,
所以它会匹配到第一个的时候就结束了,从而阻止了 * 的匹配多个的贪婪。
PS:这里再为大家提供2款非常方便的正则表达式工具供大家参考使用:
JavaScript正则表达式在线测试工具:http://tools.jb51.net/regex/javascript
正则表达式在线生成工具:http://tools.jb51.net/regex/create_reg
更多关于JavaScript相关内容感兴趣的读者可查看本站专题:《JavaScript正则表达式技巧大全》、《JavaScript替换操作技巧总结》、《JavaScript查找算法技巧总结》、《JavaScript数据结构与算法技巧总结》、《JavaScript遍历算法与技巧总结》、《JavaScript中json操作技巧总结》、《JavaScript错误与调试技巧总结》及《JavaScript数学运算用法总结》
总结
以上就是这篇文章的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,如果有疑问大家可以留言交流,谢谢大家对脚本之家的支持。
您可能感兴趣的文章:
相关文章推荐
- 正则表达式Pattern(模式类)Matcher(匹配器类)
- [00107]最短匹配模式
- 浅析正则表达式模式匹配的 String 方法
- 正则表达式惰性匹配模式(?)
- 正则表达式的模式匹配
- 正则表达式使模式匹配和数据提取变得更容易(David Banister)
- 最短摘要生成与多模式匹配(一)
- 正则表达式(grep)元字符及模式匹配的介绍及sed高级应用选项
- 正则表达式(即:匹配模式Pattern)
- Scala基础教程(八):模式匹配、正则表达式
- 老生常谈MYSQL模式匹配 REGEXP和like的用法
- 浅析正则表达式模式匹配的String方法
- MySQL 字符串模式匹配 扩展正则表达式模式匹配
- 正则表达式(五)------ 匹配模式
- sed 匹配最短模式的方法
- 正则表达式 —— 一种模式描述语言(贪婪匹配与惰性匹配)
- 辛星浅析字符模式匹配中的u模式修正符
- 正则表达式之最短匹配
- 正则表达式匹配可能包括任意长度的任意空白的任意字符串(最短匹配)
- 正则表达式贪婪模式及最短匹配