您的位置:首页 > 其它

NO.35 正则表达式的入门学习

2010-09-01 18:05 281 查看
经常听到正则表达式,但是自己一直都对他的理解相当的模糊

于是今天我就大概出略了学习了一下,算作一个入门吧,以后希望在学习能够加深对它的理解

1.首先,我了解了正则表达式是干什么的?在编写处理字符串的程序或网页时,经常会有查找符合某些复杂规则的字符串的需要。正则表达式就是用于描述这些规则的工具。换句话说,正则表达式就是记录文本规则的代码。。我自己通俗的的理解是正则表达式就是查找想到得到的字符串的规则的代码!

2.接着,我了解了一些元字符和限定符
表1.常用的元字符
代码说明
.匹配除换行符以外的任意字符
\w匹配字母或数字或下划线或汉字
\s匹配任意的空白符
\d匹配数字
\b匹配单词的开始或结束
^匹配字符串的开始
$匹配字符串的结束
表2.常用的限定符
代码/语法说明
*重复零次或更多次
+重复一次或更多次
?重复零次或一次
{n}重复n次
{n,}重复n次或更多次
{n,m}重复n到m次
3.看了这些之后我基本上可以看懂一些简单的正则表达式了,但是像这样var exp=/[0-9]/g的,我前面的[0-9]是匹配一位数字我明白,只是后面的g是个什么意思我还不知道~~于是继续学习

为了解答“正则表达式 (/[^0-9]/g,'') 中的 "/g" 是什么意思?”这个问题,也为了能够便于大家对正则表达式有一个更为综合和深刻的认识,我将一些关键点和容易犯糊涂的地方再系统总结一下。】

总结 1:附件参数 g 的用法

表达式加上参数 g 之后,表明可以进行全局匹配,注意这里“可以”的含义。我们详细叙述:

1)对于表达式对象的 exec 方法,不加入 g,则只返回第一个匹配,无论执行多少次均是如此,如果加入 g,则第一次执行也返回第一个匹配,再执行返回第二个匹配,依次类推。例如

var regx=/user\d/;

var str=“user18dsdfuser2dsfsd”;

var rs=regx.exec(str);// 此时 rs 的值为 {user1}

var rs2=regx.exec(str);// 此时 rs 的值依然为 {user1}

如果 regx=/user\d/g;则 rs 的值为 {user1},rs2 的值为 {user2}

通过这个例子说明:对于 exec 方法,表达式加入了 g,并不是说执行 exec 方法就可以返回所有的匹配,而是说加入了 g 之后,我可以通过某种方式得到所有的匹配,这里的“方式”对于 exec 而言,就是依次执行这个方法即可。

2)对于表达式对象的 test 方法,加入 g 于不加上 g 没有什么区别。

3)对于 String 对象的 match 方法,不加入 g,也只是返回第一个匹配,一直执行 match 方法也总是返回第一个匹配,加入 g,则一次返回所有的匹配(注意这与表达式对象的 exec 方法不同,对于 exec 而言,表达式即使加上了 g,也不会一次返回所有的匹配)。例如:

var regx=/user\d/;

var str=“user1sdfsffuser2dfsdf”;

var rs=str.match(regx);// 此时 rs 的值为 {user1}

var rs2=str.match(regx);// 此时 rs 的值依然为 {user1}

如果 regx=/user\d/g,则 rs 的值为 {user1,user2},rs2 的值也为 {user1,user2}

4)对于 String 对象的 replace 方法,表达式不加入 g,则只替换第一个匹配,如果加入 g,则替换所有匹配。(开头的三道测试题能很好的说明这一点)

5)对于 String 对象的 split 方法,加上 g 与不加 g 是一样的,即:

var sep=/user\d/;

var array=“user1dfsfuser2dfsf”.split(sep);

则 array 的值为 {dfsf, dfsf}

此时 sep=/user\d/g,返回值是一样的。

6)对于 String 对象的 search 方法,加不加 g 也是一样的。
  参数 g
g 只影响于 exec、match 方法。
* 若不指定 g,则:每次调用 exec 都只返回第一个匹配;match 也是只返回第一个匹配。
* 若指定 g,则:每次调用 exec 都从上一个匹配之后查找新的匹配;match 则是返回所有的匹配。

  参数 m
  m 影响对行首、行尾的解释,也就是影响 ^、$。
* 若不指定 m,则:^ 只在字符串的最开头,$ 只在字符串的最结尾。
* 若指定 m,则:^ 在字符串每一行的开头,$ 在字符串第一行的结尾。 

4.看了上面的例子后,我又对 exec和match 区别不太明白,于是继续查找答案

  参考题目:

  var someText="web2.0 .net2.0";
  var pattern=/(\w+)(\d)\.(\d)/g;
  outCome_exec=pattern.exec(someText);
  outCome_matc=someText.match(pattern);

  输出结果是什么?exec和match返回的都是数组

  结果:
  1. web2.0,web,2,0

  2. web2.0,net2.0
  总结:
  match是返回所有匹配的字符串合成的数组,但是正则表达式必须指定全局g属性才能返回所有匹配,不指定g属性则会返回一个只有一个元素的数组。
  exec永远返回与第一个匹配相关的信息,其返回数组包括第一个匹配的字串,所有分组的反向引用。

5.自己试着写了几个简单的正则,挺有意思

  

代码

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title>正则</title>
</head>
<body>
<script language="javascript">
var reg = /\d+$/;
var str = "514dfgsdg5268500";
var result = str.match(reg);
alert(result);
</script>
</body>
</html>

查找出字符串末尾的数字

6.发现学习中,学着学着就会有一个接一个问题出来,然后需要自己一一的去解决,去搞懂,这样就有收获了!~~明天继续!~~~


 
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: