php 不同编码下的字符串长度区分
2009-09-26 00:00
417 查看
UTF-8的中文字符串是三个字节
GB2312的中文字符串是二个字节
输出:17-9
在Mysql数据库(5.1以后的版本)中,如果字段类型为varchar(10)则可插入10个字符(不是字节);
所以在判断字符串的长度时需要根据文档编码来区分。
符一个简单的UTF-8下字符串截取(按字符个数截取)
<?php //编码UTF-8 echo strlen('测试文字a测试文字'); echo '-'; echo mb_strlen('测试文字a测试文字','utf-8'); ?> 输出:25-9
GB2312的中文字符串是二个字节
<?php //编码GB2312 echo strlen('测试文字a测试文字'); echo '-'; echo mb_strlen('测试文字a测试文字','Gb2312'); ?>
输出:17-9
在Mysql数据库(5.1以后的版本)中,如果字段类型为varchar(10)则可插入10个字符(不是字节);
所以在判断字符串的长度时需要根据文档编码来区分。
符一个简单的UTF-8下字符串截取(按字符个数截取)
<? /* * UTF-8字符串截取 * $str 要截取的字串 * $start 截取起始位置 * $length 截取长度 */ function cutStr($str,$start,$length) { $restr = ''; $j = 0; $end = $length + $start - 1; $plen = strlen($str); for($i=0;$i<$plen;$i++) { $restr .= ord($str[$i])>127 ? $str[$i].$str[++$i].$str[++$i] : $str[$i]; $j++; if ($j < $start){$restr = '';} if ($j >= $end){break;} } $restr .=''; return $restr; } $str = '中新网9月24日电 二十国集团(G20)领导人第三次金融峰会今日将在美国匹兹堡召开。'; echo $str; echo '<br>'; echo utf8_substr($str,0,25); echo '<br>'; ?>
相关文章推荐
- php 不同编码下的字符串长度区分
- php 不同编码下的字符串长度区分
- php计算字符串长度:utf8编码,包含中文
- php将字符串随机分割成不同长度数组的方法
- PHP不同字符集字符串长度的计算
- php将字符串随机分割成不同长度数组的方法
- php 字符串 base64编码判断
- php中支持多种编码的中文字符串截取函数!
- 用php对json字符串编码问题
- php中文字符编码的长度,以及设置得到当前(内部)编码的函数
- php中计算中文字符串长度、截取中文字符串的函数代码
- 对字符串HELL0_HULU中的字符进行二进制编码,使得字符串的编码长度尽可能短,最短长度为?
- php中iconv可将字符串从原始编码转化为指定的编码格式
- 求算一任意长度字符串中不同的字符以及它的个数
- 华为机试:计算两个字符串的最大公共字串的长度,字符不区分大小写
- 查看字符串在不同编码(ASCII、Unicode、UTF7、UTF8、Default、BigEndianUnicode)下的 Hex
- Linux下php判断字符串编码
- 支持中文的PHP按字符串长度分割成数组代码
- Java中字符串在不同字符编码中所占字节数
- php截取中文字符串长度的mb_substr()、mb_strcut()函数