您的位置:首页 > Web前端 > JavaScript

js基础正则表达式细解

2017-04-26 12:06 162 查看
目标:

1,正则语法。

2,在IDE中使用正则处理规则复杂的字符串查找 ,替换需求

3,在js程序设计中使用正则表达式处理字符串。

一,正则表达式在文本文档中的简单操作:

Regular Expression使用单个字符串来描述,匹配一系列符合某个句法规则的字符串。(就是按照某种规则去匹配符合条件的字符串)

1,通配符

find./-name*.txt在当前目录下查找txt文件。

2,正则表达式图形工具:http://regexper.com

访问不了的情况可以在GitHub上下载到本地用。(1下载代码到本地2需要有node环境,进入目录install安装。)

3,去掉http协议的jpg文件的协议头。

例如:http:\/\/.+.jpg 表示找到文件中的http协议头中的jpg文件。

.点表示任意字符,*星表示任意个数,\反斜杠是转义字符(符号冲突时需要用到反斜杠转义符)

分组替换:http:(\/\/.+.jpg),→$1或者\$1转义替换 →结果就是替掉了http。

4,日期替换

2006/02/03

test/07/sd

2016/05/06

1998-03-07

12345/23/45678

1234/23/45678

12345/23/45

正在写法:^\d{4}[/-]\d{2}[/-]\d{2}解析:四<
4000
/span>个数字+斜杠或者横杠表示开头,表示结尾,\d表示数字,{数字}表示量词,[]中括号内表示或者(中括号内的其中一个)。

正则括号提取: ^(\d{4})/-/-替换成月日年:2-3−1(表示第二组-第三组-第一组)。



二,正则在js对象中的操作:

js通过内置对象RegExp支持正则表达式:

有两种方法实例化RegExp对象

1,字面量

var reg=/\bis\b/g;(正则文本写在反斜杠之间,\b表示单词边界,边界内写内容,g代表global,匹配全文的意思)

定义正则表达式:

js中字符串的replace方法,可以查找替换,

2,构造函数方式

var reg=new RegExp(’\bis\b’,’g’)

(js中反斜杠本身就是特殊字符,所以需要用反斜杠进行转义,)

3,修饰符

g:global全文搜索,不添加g,搜索到第一个匹配停止。

i:ignore case忽略大小写,默认大小写敏感。

m:multiple lines表示多行搜索。

4,元字符

正则表达式由两种基本字符类型组成,

1,愿义文本字符,2,元字符

元字符是正则中有特殊含义的非字母字符 。

*+?¥^.|(){}[]



5,字符类:

①ab\t含义;字母ab和水平制表符对应

②需要匹配一系列特征的字符时,可以使用元字符[]中括号来构建一个简单的类。([abc]把字符a或b或c自定义归为一类,表达式可以匹配这类的字符)

字符类取反[^abc]

6,范围类:

[a-z]闭区间,

7,预定义类:



匹配一个ab+数字+任意字符 的字符串

ab\d.

8,边界匹配

\d就是单词边界



m表示多行匹配。

9,量词



10,贪婪模式和非贪婪模式

量词后边加?号即为非贪婪模式,尽可能少的匹配。

11,括号分组:

匹配字符串Byron连续出现3次的场景。

Byron{3}

12,反向引用:

1−n 表示捕获分组,

13,忽略分组

需要在分组内加上?:

(?:Byron).(ok)

14,前瞻

正则从文本头部向尾部开始解析,文本尾部方向,成为“前”。

前瞻就是正则表达式匹配到规则的时候,向前检查是否符合断言。

js不支持后顾/后瞻

符合和不符合特定断言成为 肯定/正向 匹配和 否定/负向 匹配。

写法:

正向前瞻:exp(?=assert)例如/\w(?=\d)/g,’x’/

负向前瞻:exp(?!assert)

三。js对象属性:

global全文搜索,默认值false。

ignore case是否大小写敏感,默认值false。

multiple lines多行搜索,默认值false。

lastIndex:是当前表达式匹配内容的最后一个字符的下一个位置。

source:正则表达式的文本字符串。

js中正则表达式的两种方法(test和exec方法。):

1,test方法:

RegExp.prototype.test(str);

作用:用来测试字符串参数中是否存在匹配正则表达式模式的字符串。

返回值:true或flase。

由于lastIndex的原因,

2,exec方法

RegExp.prototype.exec(str);

作用:使用正则表达式模式对字符串执行搜索,并将更新全局RegExp对象的属性以反映匹配结果。

返回值:null或者数组。

数组中有两个额外属性:

Index声明匹配文字的第一个字符的位置

input存放被检索的字符串string。

3,非全局调用:

调用非全局的RegExp对象的exec()时,返回数组。

第一个元素是与正则表达式想匹配的文本,

第二个元素是与RegExpObject的第一个子表达式相匹配的文本(如果有的话)

第三个元素是与RegExp对象的第二个子表达式相匹配的文本(如果有的话),以此类推。



,可以用while循环来检测字符串,把每次的结果是从谁开始匹配的,匹配的位置,匹配的结果,里边的分组。常用。

var reg3=/\d(\w)(\w)\d/;
var reg4=/\d(\w)(\w)\d/g;

var ret=reg.exec(ts);

console.log(reg3.lastIndex+'\t'+ret.index+'\t'+ret.toString());

while(ret=reg4.exec(ts)){
console.log(reg4.lastIndex+'\t'+ret.index+'\t'+ret.toString());
b6cb
}


四,字符串对象:

stringl.protatype.search(reg)
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: