PHP扩展之文本处理(二)——PCRE正则表达式语法4——Unicode字符属性
2014-11-07 00:00
1266 查看
自从 PHP 4.4.0 和 5.1.0, 三个额外的转义序列在选用 UTF-8模式时用于匹配通用字符类型。他们是:
\p{xx}
一个有属性 xx 的字符
\P{xx}
一个没有属性 xx 的字符
\X
一个扩展的 Unicode 字符
上面 xx 代表的属性名用于限制 Unicode 通常的类别属性。 每个字符都有一个这样的确定的属性,通过两个缩写的字母指定。 为了与 perl 兼容, 可以在左花括号 { 后面增加 ^ 表示取反。比如: \p{^Lu} 就等同于 \P{Lu}。
如果通过 \p 或 \P 仅指定了一个字母,它包含所有以这个字母开头的属性。 在这种情况下,花括号的转义序列是可选的。
\p{xx}
一个有属性 xx 的字符
\P{xx}
一个没有属性 xx 的字符
\X
一个扩展的 Unicode 字符
上面 xx 代表的属性名用于限制 Unicode 通常的类别属性。 每个字符都有一个这样的确定的属性,通过两个缩写的字母指定。 为了与 perl 兼容, 可以在左花括号 { 后面增加 ^ 表示取反。比如: \p{^Lu} 就等同于 \P{Lu}。
如果通过 \p 或 \P 仅指定了一个字母,它包含所有以这个字母开头的属性。 在这种情况下,花括号的转义序列是可选的。
\p{L} \pL
相关文章推荐
- PHP扩展之文本处理(二)——PCRE正则表达式语法8——子组(子模式)
- PHP扩展之文本处理(二)——PCRE正则表达式语法13——条件子组
- PHP扩展之文本处理(二)——PCRE正则表达式语法9——重复/量词
- PHP扩展之文本处理(二)——PCRE正则表达式语法2——元字符
- PHP扩展之文本处理(二)——PCRE正则表达式语法1——分隔符
- PHP扩展之文本处理(二)——PCRE正则表达式语法6——字符类(方括号)和可选路径(|)
- PHP扩展之文本处理(二)——PCRE正则表达式语法12——一次性子组
- PHP扩展之文本处理(二)——PCRE正则表达式语法14——注释及递归模式
- PHP扩展之文本处理(二)——PCRE正则表达式语法10——后向引用
- PHP扩展之文本处理(二)——PCRE正则表达式语法15——性能
- PHP扩展之文本处理(二)——PCRE正则表达式语法11——断言
- PHP扩展之文本处理(二)——PCRE正则表达式语法7——内部选项设置
- PHP扩展之文本处理(二)——PCRE正则表达式语法3——转义序列(反斜线)
- PHP扩展之文本处理(二)——PCRE正则表达式语法5——锚和句点
- PHP扩展之文本处理(三)——POSIX正则表达式函数及使用示例
- php中的PCRE 函数,正则表达式处理函数。
- 字符及文本处理之二:grep及正则表达式详解
- PHP中正则表达式对UNICODE字符码的匹配方法