您的位置：首页 > 编程语言 > Java开发

正则表达式

2017-06-02 09:57 176 查看

正则表达式作用：能够与多种字符匹配的表达式

正则表达式的优势和用途：

1、一种强大而领活的文本处理工具

2、大部分编程语言、数据库、文本编辑器、开发环境都支持正则表达式。

标准字符集合（区分大小写，大写表示相反的意思）

\d 任意一个数字，0～9中的任意一个值

\w 任意一个字母或数字或下划线，也就是A～Z，a～z，0～9，_中任意一个

\s 包括空格、制表符、换行符等空白字符的其中任意一个

. 小数点可以匹配任意一个字符(除了换行符)如果要匹配括号"\n"在内的所有字符，一般用[\s\S]

自定义字符集合：[] 中括号匹配方式，能够匹配中括号中任意一个字符

[abc@] 匹配“a” 或 “b” 或 “c” 或 “@”

[^abc] 匹配“a”，“b”，“c” 之外的任意一个字符

[f-k] 匹配“f”～“k”之间的任意一个字符

[^A-Z6-9] 匹配“A”～“Z”，“6”～“9”之外的任意一个字符，除了^,-之外

正则表达式的特殊符号，被包含到中括号中，则失去特殊意义

量词：修饰匹配次数的特殊符号

{n} 表达式重复n次

{m,n} 表达式至少重复m次，最多重复n次

{m,} 表达式至少重复m次，最多不限制

? 表达式0次或者1次，相当于{0,1}

+ 表达式至少出现1次，相当于{1,}

* 表达式不出现或者出现任意次数，相当于{0,}

匹配次数中的贪婪模式(匹配字符越多越好，默认是贪婪模式)

匹配次数中的非贪婪模式(匹配字符越少越好，修饰匹配次数的特殊符号后再加上一个“？”)

字符边界（标记匹配的不是字符而是位置，符合某种条件的位置）

^ 与字符串开始的地方匹配

$ 与字符串结束的地方匹配

\b 匹配一个单词的边界

－－－－－－\b匹配的是：前面的字符和后面的字符不全是\w

正则表达式的匹配模式

IGNORECASE忽略大小写模式

1、匹配时忽略大小写

2、默认情况下，正则表达式是区分大小写的

SINGLELINE 单行模式

1、整个文本看作是一个字符串，只有一个开头，一个结尾

2、使用小数点“.” 可以匹配包含换行符“\n”在内的任意字符

MULTILINE多行模式

1、每行都是一个字符串，都有开头和结尾

2、在指定了MULTILINE后，如果需要只匹配字符串的开始和结束位置，可以使用\A和\Z

选择符和分组

| 左右两边表达式之间“或”的关系，匹配左边或者右边

1、在被修饰匹配次数的时候，括号中的表达式可以作为整体被修饰

() 2、取匹配结果的时候，括号中的表达式匹配到的内容可以被单独得到

3、每一堆括号会分配一个编号，使用()得捕获根据做括号得顺序从1开始自动编号。捕获元素编号为零的第一个捕获是由整个表达式模式匹配的文本()

(?:Expression) 一些表达式中，不得不使用(),但又不需要保存()中子表达式匹配的内容，这时可以使用非捕获组来低消使用()带来的副作用

反向引用(\nnn)

每一对()会分配一个编号，使用()的捕获根据做括号的顺序从一开始自动编号。

通过反向引用，可以对分组已捕获的字符串进行引用

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： 正则表达式文本编辑 java

相关文章推荐

新的分享

章节导航