您的位置:首页 > 其它

正则表达式 相关学习链接

2013-10-18 09:58 190 查看

JDK7 官网api的说明


JavaScript RegExp 对象参考手册

http://www.w3school.com.cn/js/jsref_obj_regexp.asp


RegExp 对象

RegExp 对象表示正则表达式,它是对字符串执行模式匹配的强大工具。

直接量语法

/pattern/attributes

创建 RegExp 对象的语法:

new RegExp(pattern, attributes);

参数

参数 pattern 是一个字符串,指定了正则表达式的模式或其他正则表达式。

参数 attributes 是一个可选的字符串,包含属性 "g"、"i" 和 "m",分别用于指定全局匹配、区分大小写的匹配和多行匹配。ECMAScript 标准化之前,不支持 m 属性。如果 pattern 是正则表达式,而不是字符串,则必须省略该参数。

返回值

一个新的 RegExp 对象,具有指定的模式和标志。如果参数 pattern 是正则表达式而不是字符串,那么 RegExp() 构造函数将用与指定的 RegExp 相同的模式和标志创建一个新的 RegExp 对象。

如果不用 new 运算符,而将 RegExp() 作为函数调用,那么它的行为与用 new 运算符调用时一样,只是当 pattern 是正则表达式时,它只返回 pattern,而不再创建一个新的 RegExp 对象。

抛出

SyntaxError - 如果 pattern 不是合法的正则表达式,或 attributes 含有 "g"、"i" 和 "m" 之外的字符,抛出该异常。

TypeError - 如果 pattern 是 RegExp 对象,但没有省略 attributes 参数,抛出该异常。


修饰符

修饰符描述
i执行对大小写不敏感的匹配。
g执行全局匹配(查找所有匹配而非在找到第一个匹配后停止)。
m执行多行匹配。


方括号

方括号用于查找某个范围内的字符:
表达式描述
[abc]查找方括号之间的任何字符。
[^abc]查找任何不在方括号之间的字符。
[0-9]查找任何从 0 至 9 的数字。
[a-z]查找任何从小写 a 到小写 z 的字符。
[A-Z]查找任何从大写 A 到大写 Z 的字符。
[A-z]查找任何从大写 A 到小写 z 的字符。
[adgk]查找给定集合内的任何字符。
[^adgk]查找给定集合外的任何字符。
(red|blue|green)查找任何指定的选项。


元字符

元字符(Metacharacter)是拥有特殊含义的字符:
元字符描述
.查找单个字符,除了换行和行结束符。
\w查找单词字符。
\W查找非单词字符。
\d查找数字。
\D查找非数字字符。
\s查找空白字符。
\S查找非空白字符。
\b匹配单词边界。
\B匹配非单词边界。
\0查找 NUL 字符。
\n查找换行符。
\f查找换页符。
\r查找回车符。
\t查找制表符。
\v查找垂直制表符。
\xxx查找以八进制数 xxx 规定的字符。
\xdd查找以十六进制数 dd 规定的字符。
\uxxxx查找以十六进制数 xxxx 规定的 Unicode 字符。


量词

量词描述
n+匹配任何包含至少一个 n 的字符串。
n*匹配任何包含零个或多个 n 的字符串。
n?匹配任何包含零个或一个 n 的字符串。
n{X}匹配包含 X 个 n 的序列的字符串。
n{X,Y}匹配包含 X 或 Y 个 n 的序列的字符串。
n{X,}匹配包含至少 X 个 n 的序列的字符串。
n$匹配任何结尾为 n 的字符串。
^n匹配任何开头为 n 的字符串。
?=n匹配任何其后紧接指定字符串 n 的字符串。
?!n匹配任何其后没有紧接指定字符串 n 的字符串。


RegExp 对象属性

FF: Firefox, IE: Internet Explorer
属性描述FFIE
globalRegExp 对象是否具有标志 g。14
ignoreCaseRegExp 对象是否具有标志 i。14
lastIndex一个整数,标示开始下一次匹配的字符位置。14
multilineRegExp 对象是否具有标志 m。14
source正则表达式的源文本。14


RegExp 对象方法

FF: Firefox, IE: Internet Explorer
方法描述FFIE
compile编译正则表达式。14
exec检索字符串中指定的值。返回找到的值,并确定其位置。14
test检索字符串中指定的值。返回 true 或 false。14


支持正则表达式的 String 对象的方法

FF: Firefox, IE: Internet Explorer
方法描述FFIE
search检索与正则表达式相匹配的值。14
match找到一个或多个正则表达式的匹配。14
replace替换与正则表达式匹配的子串。14
split把字符串分割为字符串数组。14
http://www.css119.com/book/RegExp/


WEB前端开发首页正则表达式速查表

字符描述
\将下一个字符标记为一个特殊字符、或一个原义字符、或一个向后引用、或一个八进制转义符。例如,“
n
"匹配字符"
n
"。"
\n
"匹配一个换行符。串行"
\\
"匹配"
\
"而"
\(
"则匹配"
(
"。
^匹配输入字符串的开始位置。如果设置了RegExp对象的Multiline属性,^也匹配“
\n
"或"
\r
"之后的位置。
$匹配输入字符串的结束位置。如果设置了RegExp对象的Multiline属性,$也匹配“
\n
"或"
\r
"之前的位置。
*匹配前面的子表达式零次或多次。例如,zo*能匹配“
z
"以及"
zoo
"。*等价于{0,}。
+匹配前面的子表达式一次或多次。例如,“
zo+
"能匹配"
zo
"以及"
zoo
",但不能匹配"
z
"。+等价于{1,}。
?匹配前面的子表达式零次或一次。例如,“
do(es)?
"可以匹配"
does
"或"
does
"中的"
do
"。?等价于{0,1}。
{n}n是一个非负整数。匹配确定的n次。例如,“
o{2}
"不能匹配"
Bob
"中的"
o
",但是能匹配"
food
"中的两个o。
{n,}n是一个非负整数。至少匹配n次。例如,“
o{2,}
"不能匹配"
Bob
"中的"
o
",但能匹配"
foooood
"中的所有o。"
o{1,}
"等价于"
o+
"。"
o{0,}
"则等价于"
o*
"。
{n,m}m和n均为非负整数,其中n<=m。最少匹配n次且最多匹配m次。例如,“
o{1,3}
"将匹配"
fooooood
"中的前三个o。"
o{0,1}
"等价于"
o?
"。请注意在逗号和两个数之间不能有空格。
?当该字符紧跟在任何一个其他限制符(*,+,?,{n},{n,},{n,m})后面时,匹配模式是非贪婪的。非贪婪模式尽可能少的匹配所搜索的字符串,而默认的贪婪模式则尽可能多的匹配所搜索的字符串。例如,对于字符串“
oooo
","
o+?
"将匹配单个"
o
",而"
o+
"将匹配所有"
o
"。
.匹配除“
\
n
"之外的任何单个字符。要匹配包括"
\
n
"在内的任何字符,请使用像"
(.|\n)
"的模式。
(pattern)匹配pattern并获取这一匹配。所获取的匹配可以从产生的Matches集合得到,在VBScript中使用SubMatches集合,在JScript中则使用$0…$9属性。要匹配圆括号字符,请使用“
\(
"或"
\)
"。
(?:pattern)匹配pattern但不获取匹配结果,也就是说这是一个非获取匹配,不进行存储供以后使用。这在使用或字符“
(|)
"来组合一个模式的各个部分是很有用。例如"
industr(?:y|ies)
"就是一个比"
industry|industries
"更简略的表达式。
(?=pattern)正向肯定预查,在任何匹配pattern的字符串开始处匹配查找字符串。这是一个非获取匹配,也就是说,该匹配不需要获取供以后使用。例如,“
Windows(?=95|98|NT|2000)
"能匹配"
Windows2000
"中的"
Windows
",但不能匹配"
Windows3.1
"中的"
Windows
"。预查不消耗字符,也就是说,在一个匹配发生后,在最后一次匹配之后立即开始下一次匹配的搜索,而不是从包含预查的字符之后开始。
(?!pattern)正向否定预查,在任何不匹配pattern的字符串开始处匹配查找字符串。这是一个非获取匹配,也就是说,该匹配不需要获取供以后使用。例如“
Windows(?!95|98|NT|2000)
"能匹配"
Windows3.1
"中的"
Windows
",但不能匹配"
Windows2000
"中的"
Windows
"。预查不消耗字符,也就是说,在一个匹配发生后,在最后一次匹配之后立即开始下一次匹配的搜索,而不是从包含预查的字符之后开始
(?<=pattern)反向肯定预查,与正向肯定预查类拟,只是方向相反。例如,“
(?<=95|98|NT|2000)Windows
"能匹配"
2000Windows
"中的"
Windows
",但不能匹配"
3.1Windows
"中的"
Windows
"。
(?<!pattern)反向否定预查,与正向否定预查类拟,只是方向相反。例如“
(?<!95|98|NT|2000)Windows
"能匹配"
3.1Windows
"中的"
Windows
",但不能匹配"
2000Windows
"中的"
Windows
"。
x|y匹配x或y。例如,“
z|food
"能匹配"
z
"或"
food
"。"
(z|f)ood
"则匹配"
zood
"或"
food
"。
[xyz]字符集合。匹配所包含的任意一个字符。例如,“
[abc]
"可以匹配"
plain
"中的"
a
"。
[^xyz]负值字符集合。匹配未包含的任意字符。例如,“
[^abc]
"可以匹配"
plain
"中的"
p
"。
[a-z]字符范围。匹配指定范围内的任意字符。例如,“
[a-z]
"可以匹配"
a
"到"
z
"范围内的任意小写字母字符。
[^a-z]负值字符范围。匹配任何不在指定范围内的任意字符。例如,“
[^a-z]
"可以匹配任何不在"
a
"到"
z
"范围内的任意字符。
\b匹配一个单词边界,也就是指单词和空格间的位置。例如,“
er\b
"可以匹配"
never
"中的"
er
",但不能匹配"
verb
"中的"
er
"。
\B匹配非单词边界。“
er\B
"能匹配"
verb
"中的"
er
",但不能匹配"
never
"中的"
er
"。
\cx匹配由x指明的控制字符。例如,\cM匹配一个Control-M或回车符。x的值必须为A-Z或a-z之一。否则,将c视为一个原义的“
c
"字符。
\d匹配一个数字字符。等价于[0-9]。
\D匹配一个非数字字符。等价于[^0-9]。
\f匹配一个换页符。等价于\x0c和\cL。
\n匹配一个换行符。等价于\x0a和\cJ。
\r匹配一个回车符。等价于\x0d和\cM。
\s匹配任何空白字符,包括空格、制表符、换页符等等。等价于[ \f\n\r\t\v]。
\S匹配任何非空白字符。等价于[^ \f\n\r\t\v]。
\t匹配一个制表符。等价于\x09和\cI。
\v匹配一个垂直制表符。等价于\x0b和\cK。
\w匹配包括下划线的任何单词字符。等价于“
[A-Za-z0-9_]
"。
\W匹配任何非单词字符。等价于“
[^A-Za-z0-9_]
"。
\xn匹配n,其中n为十六进制转义值。十六进制转义值必须为确定的两个数字长。例如,“
\x41
"匹配"
A
"。"
\x041
"则等价于"
\x04&1
"。正则表达式中可以使用ASCII编码。.
\num匹配num,其中num是一个正整数。对所获取的匹配的引用。例如,“
(.)\1
"匹配两个连续的相同字符。
\n标识一个八进制转义值或一个向后引用。如果\n之前至少n个获取的子表达式,则n为向后引用。否则,如果n为八进制数字(0-7),则n为一个八进制转义值。
\nm标识一个八进制转义值或一个向后引用。如果\nm之前至少有nm个获得子表达式,则nm为向后引用。如果\nm之前至少有n个获取,则n为一个后跟文字m的向后引用。如果前面的条件都不满足,若n和m均为八进制数字(0-7),则\nm将匹配八进制转义值nm。
\nml如果n为八进制数字(0-3),且m和l均为八进制数字(0-7),则匹配八进制转义值nml。
\un匹配n,其中n是一个用四个十六进制数字表示的Unicode字符。例如,\u00A9匹配版权符号(©)。


常用正则表达式

用户名/^[a-z0-9_-]{3,16}$/
密码/^[a-z0-9_-]{6,18}$/
十六进制值/^#?([a-f0-9]{6}|[a-f0-9]{3})$/
电子邮箱/^([a-z0-9_\.-]+)@([\da-z\.-]+)\.([a-z\.]{2,6})$/

/^[a-z\d]+(\.[a-z\d]+)*@([\da-z](-[\da-z])?)+(\.{1,2}[a-z]+)+$/
URL/^(https?:\/\/)?([\da-z\.-]+)\.([a-z\.]{2,6})([\/\w \.-]*)*\/?$/
IP 地址/((2[0-4]\d|25[0-5]|[01]?\d\d?)\.){3}(2[0-4]\d|25[0-5]|[01]?\d\d?)/

/^(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)$/
HTML 标签/^<([a-z]+)([^<]+)*(?:>(.*)<\/\1>|\s+\/>)$/
删除代码\\注释(?<!http:|\S)//.*$
Unicode编码中的汉字范围/^[\u2E80-\u9FFF]+$/
以及

正则表达式30分钟教程

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: