您的位置:首页 > 编程语言 > Java开发

Java中的string实际长度详解(代码点和代码单元)

2017-09-06 14:44 579 查看
关于代码点和代码单元的介绍在前面的char类型介绍已经做过详细的介绍,现在专门讨论Java中和String有关的代码点和代码单元;Java中的字符串有char序列组成,在前面讲过,char数据类型是一个采用UTF-16编码表示的Unicode代码点的代码单元。我们常用的大多数Unicode字符使用一个代码单元就可以表示,辅助的字符需要两个代码单元表示。

length返回给定的UTF-16编码给定的字符串所需要的代码单元的数量。如下:

String str = "Hello";
int strLength = str.length();这里得到的是代码单元的数量,要想得到实际的长度,也就是代码点的长度,使用如下代码:
int cpCount = str.codePointCount(0, str.length());使用codePointCount()方法可以得到实际的长度,为什么会这样了?因为基本的多语言级别由16个字符组成,也就是一个字符,但是辅助的字符,需要两个代码点,所以使用length等不到辅助字符的实际长度。
那么,要想得到第n位置的代码点,我们需要怎么做了,如下:

int index = str.offsetByCodePoints(0, 3);
int cp = str.codePointAt(index);
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: