您的位置:首页 > 编程语言 > PHP开发

editplus 里面的正则表达式

2017-09-24 23:56 162 查看
Editplus 是windows平台里常用的多功能编辑器,一直不忍放弃。其实它也支持RE,只是功能有限。

参考博文 http://www.williamlong.info/archives/4448.html

总结如下:

1. 不支持 重复频度 的定义,如:{3}、{3,}、{3,6}...

2. 支持的元字符比较少,列表如下:

     空格  直接键入,不支持\b

\t      制表符.

\n      新行.

  .      匹配任意字符.

  |      匹配表达式左边和右边的字符. 例如, "ab|bc" 匹配 "ab" 或者 "bc".

  []      匹配列表之中的任何单个字符. 例如, "[ab]" 匹配 "a" 或者 "b". "[0-9]" 匹配任意数字.

  [^]     匹配列表之外的任何单个字符.例如, "[^ab]" 匹配 "a" 和 "b" 以外的字符. "[^0-9]" 匹配任意非数字字符.

  *      其左边的字符被匹配任意次(0次,或者多次). 例如 "be*" 匹配 "b", "be" 或者 "bee".

  +      其左边的字符被匹配至少一次(1次,或者多次). 例如 "be+" 匹配 "be" 或者 "bee" 但是不匹配 "b".

  ?      其左边的字符被匹配0次或者1次. 例如 "be?" 匹配 "b" 或者 "be" 但是不匹配 "bee".

  ^      其右边的表达式被匹配在一行的开始.例如 "^A" 仅仅匹配以 "A" 开头的行.

  $      其左边的表达式被匹配在一行的结尾. 例如 "e$" 仅仅匹配以 "e" 结尾的行.

  ()      影响表达式匹配的顺序,并且用作表达式的分组标记.

  \      转义字符. 如果你要使用 "\" 本身, 则应该使用 "\\".

3. 几个特殊实例:

     3.1 数字替换

  把          a1hij23bcd456ef7890xyz

  替换为:  a[1]hij[23]bcd[456]ef[7890]xyz

方法: [0-9]+ → [\0\1\2], 其中\0\1\2是定位原字符

  3.2 删除每一行行尾的指定字符 

  cat a.txt

  12345 1265345

  2345

  删除每行末尾的“345”

   方法345$ → 空  如果是行首,则前面加“^”

     3.3 删除空行 :   ^[ \t]*\n → 空 (推荐)  或  [\n]+ → \n

   note:\t前有空格符" "。我们把仅有空格符和制表符的行也当做空行。   

     3.4 替换带有半角括号的多行

  几百个网页中都有下面一段代码,我想把它们都去掉,可是找了很多search&replace的软件,都是只能对“一行”进行操作。

  EditPlus打开几百个网页文件还是比较顺畅的,所以完全可以胜任这个工作。

  方法:在Editplus中使用正则表达式,由于“(”、“)”被用做预设表达式(或者可以称作子表达式)的标志,所以需要使用\转义。

  3.5中间包含文字替换

  如果要替换中间包含某文字的一行,例如包含yahoo,则可使用如下表达式匹配一行内容

  ^.*yahoo.*

  中间不包含文字替换

  如果要替换中间不包含某文字的一行,例如不包含yahoo,则可使用如下表达式匹配一行内容

  ^(?!.*yahoo).*

3.6查找url并提取

  www.baidu.com">http://www.baidu.com

  方法:  ()→\1  或 (http://.*)→\1

 
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息