PHP 中文字符串截取无乱码的方法以及php汉字截取函数_preg_split()
2013-11-01 11:16
1066 查看
昨天,在写代码时我遇到了一个中文字符串截取的问题,原本是想直接用substr()来,但这个是在单字节符下用的,对于多字节编码的汉字或是其它语言字符中,这个函数可能就用不上了,而且会容易截出乱码来!
现在就把我的下工作记录和总结给大家分享一下:
问题产生及使用案例网站:天气预报15天查询(http://tqybw.net)
问题时间:2013-10-31
解决思路:把汉字按一个汉字在编码下按其在完整性正则分割成数组,再根据需要取截取长度;
1、实现方法函数
开启mbstring扩展,然后自定义函数:
2、主要函数功能说明preg_split:
对于初学者来说,大家对 说明 array preg_split ( string $pattern, string $subject [, int $limit [, int $flags]] )
返回一个数组,包含 subject 中沿着与 pattern 匹配的边界所分割的子串。
如果指定了 limit,则最多返回 limit 个子串,如果 limit 是 -1,则意味着没有限制,可以用来继续指定可选参数 flags。
flags 可以是下列标记的任意组合(用按位或运算符 | 组合):
PREG_SPLIT_NO_EMPTY
如果设定了本标记,则 preg_split() 只返回非空的成分。
PREG_SPLIT_DELIM_CAPTURE
如果设定了本标记,定界符模式中的括号表达式也会被捕获并返回。本标记添加于 PHP 4.0.5。
PREG_SPLIT_OFFSET_CAPTURE
如果设定了本标记,如果设定本标记,对每个出现的匹配结果也同时返回其附属的字符串偏移量。注意这改变了返回的数组的值,使其中的每个单元也是一个数组,其中第一项为匹配字符串,第二项为其在 subject 中的偏移量。本标记自 PHP 4.3.0 起可用。
提示
如果不需要正则表达式的功能,可以选择使用更快(也更简单)的替代函数如 explode() 或 str_split()。
3、array_slice说明:
array_slice() 函数在数组中根据条件取出一段值,并返回。
本文讲述了PHP 中文字符串截取无乱码方法,希望本文能给读者带来灵感,帮助读者解决疑问,感谢阅读本文。
现在就把我的下工作记录和总结给大家分享一下:
问题产生及使用案例网站:天气预报15天查询(http://tqybw.net)
问题时间:2013-10-31
解决思路:把汉字按一个汉字在编码下按其在完整性正则分割成数组,再根据需要取截取长度;
1、实现方法函数
开启mbstring扩展,然后自定义函数:
<?php header('content-Type:text/html:charset=utf-8'); function substr_chinese($str, $start, $length = null) { return join("", array_slice( preg_split("//u", $str, -1, PREG_SPLIT_NO_EMPTY), $start, $length) ); } (PS:^_^不错的php学习交流群:276167802,验证:csl,谢谢!) //实例 $str = "中国地图全图"; echo substr_utf8($str, 0, 4); //输出: 中国地图 ?>
2、主要函数功能说明preg_split:
对于初学者来说,大家对 说明 array preg_split ( string $pattern, string $subject [, int $limit [, int $flags]] )
返回一个数组,包含 subject 中沿着与 pattern 匹配的边界所分割的子串。
如果指定了 limit,则最多返回 limit 个子串,如果 limit 是 -1,则意味着没有限制,可以用来继续指定可选参数 flags。
flags 可以是下列标记的任意组合(用按位或运算符 | 组合):
PREG_SPLIT_NO_EMPTY
如果设定了本标记,则 preg_split() 只返回非空的成分。
PREG_SPLIT_DELIM_CAPTURE
如果设定了本标记,定界符模式中的括号表达式也会被捕获并返回。本标记添加于 PHP 4.0.5。
PREG_SPLIT_OFFSET_CAPTURE
如果设定了本标记,如果设定本标记,对每个出现的匹配结果也同时返回其附属的字符串偏移量。注意这改变了返回的数组的值,使其中的每个单元也是一个数组,其中第一项为匹配字符串,第二项为其在 subject 中的偏移量。本标记自 PHP 4.3.0 起可用。
提示
如果不需要正则表达式的功能,可以选择使用更快(也更简单)的替代函数如 explode() 或 str_split()。
3、array_slice说明:
array_slice() 函数在数组中根据条件取出一段值,并返回。
<?php $a=array(0=>"Dog",1=>"Cat",2=>"Horse",3=>"Bird"); print_r(array_slice($a,1,2)); ?> 输出:Array ( [0] => Cat [1] => Horse )
本文讲述了PHP 中文字符串截取无乱码方法,希望本文能给读者带来灵感,帮助读者解决疑问,感谢阅读本文。
相关文章推荐
- PHP中文字符串截取无乱码方法,php汉字截取函数_preg_split()
- PHP的两个常用函数截取中文字符串无乱码与获取客户端IP地址
- PHP 字符串长度计算函数strlen() 正确的计算 中文汉字长度的方法 与mb_strlen()应用
- 用PHP来截取中文字符串而不出现乱码的实现方法
- PHP字符串截取函数(解决中文乱码问题!支持UTF-8和GB2312)
- PHP中的字符串截取函数,取子符串,以保证中文不出现乱码
- PHP开发小技巧⑩—实现中文字符串截取无乱码的方法
- PHP的strtolower()和strtoupper()函数在安装非中文系统的服务器下可能会导致将汉字转换为乱码,请写两个替代的函数实现兼容Unicode文字的字符串大小写转换
- php截取中文字符串不乱码的方法
- php 字符串操作函数substr()截取中文子串乱码问题
- php截取中文字符串不乱码的方法
- 用php截取utf-8中文字符串乱码的解决方法
- php截取中文字符串不乱码的方法
- php截取中文字符串无乱码的函数(主函数:ord()、substr())
- php截取utf-8中文字符串乱码的解决方法
- php截取utf-8中文字符串乱码的解决方法
- php截取中文字符串无乱码的方法
- PHP的两个常用函数截取中文字符串无乱码与获取客户端IP地址
- 支持中文的PHP字符串截取函数 (附各语言的字符集编码范围)
- PHP截取中文字符串方法总结