php将中文转换成相应匹配的正则表达式(要求原文本为utf-8编码)
2013-08-31 20:23
931 查看
<?php function getUnicodeReg($word) { // 拆分汉字 preg_match_all('#(?:[\x00-\x7F]|[\xC0-\xFF][\x80-\xBF]+)#s', $word, $array, PREG_PATTERN_ORDER); $return = array(); // 转换 foreach ($array[0] as $cc) { $arr = str_split($cc); $bin_str = ''; foreach ($arr as $value) { $bin_str .= decbin(ord($value)); } $bin_str = preg_replace('/^.{4}(.{4}).{2}(.{6}).{2}(.{6})$/','$1$2$3', $bin_str); $return[] = '\u' . dechex(bindec($bin_str)); } $return = '/'.implode('', $return).'/u'; return $return; } $word = '甲方乙方'; echo getUnicode($word); ?>
附utf-8编码表:http://www.chi2ko.com/tool/CJK.htm
方法来源于网上搜集跟自己加工,文本出自:http://blog.csdn.net/nancle/article/details/10769537
相关文章推荐
- PHP正则表达式 中文匹配 UTF-8编码下的的注意事项
- UTF-8编码时,PHP如何正则匹配中文汉字?亲测可用
- PHP匹配UTF-8中文字符的正则表达式
- php中utf-8编码下用正则表达式匹配汉字的最终正确表达式——/[\x{4e00}-\x{9fa5}]/u
- php中utf-8编码下用正则表达式如何匹配汉字
- 正确的PHP匹配UTF-8中文的正则表达式
- php中utf-8编码下用正则表达式匹配汉字的最终正确表达式——/^[x{4e00}-x{9fa5}]+$/u
- php utf-8编码 正则匹配中文
- 正确的PHP匹配UTF-8中文的正则表达式
- [转]Python正则表达式中匹配GBK/UTF-8编码中文字符_绝冬之地_百度空间
- php中utf-8编码下用正则表达式如何匹配汉字
- php中utf-8编码和GB2312编码下用正则表达式匹配汉字
- php中utf-8编码下用正则表达式如何匹配汉字
- php中utf-8编码下用正则表达式如何匹配汉字
- php中utf-8编码下用正则表达式如何匹配汉字
- php匹配中文_英文_数字的正则表达式
- php 正则表达式匹配中文
- PHP匹配中文的正则表达式
- PHP正则表达式匹配中文字符
- php用正则表达式匹配中文实例详解