Java字符串找出4个字节长度的字符
2015-09-11 16:39
363 查看
不解释,直接上代码:
由于Iteye代码贴四个字节的UTF-8字符出错,特能图的方式发布几个特殊字符:
Java代码
public class Byte4Check {
public static void main(String args[]) throws UnsupportedEncodingException {
String nickName = "12葫";
byte[] t = nickName.substring(0, 1).getBytes("UTF-8");
for (byte tt : t) {
System.out.println(tt);
}
System.out.println("====================");
byte[] t1 = nickName.getBytes("UTF-8");
for (int i = 0; i < t1.length;) {
byte tt = t1[i];
if (CharUtils.isAscii((char) tt)) {
byte[] ba = new byte[1];
ba[0] = tt;
i++;
String result = new String(ba);
System.out.println("1个字节的字符");
System.out.println("字符为:" + result);
}
if ((tt & 0xE0) == 0xC0) {
byte[] ba = new byte[2];
ba[0] = tt;
ba[1] = t1[i+1];
i++;
i++;
String result = new String(ba);
System.out.println("2个字节的字符");
System.out.println("字符为:" + result);
}
if ((tt & 0xF0) == 0xE0) {
byte[] ba = new byte[3];
ba[0] = tt;
ba[1] = t1[i+1];
ba[2] = t1[i+2];
i++;
i++;
i++;
String result = new String(ba);
System.out.println("3个字节的字符");
System.out.println("字符为:" + result);
}
if ((tt & 0xF8) == 0xF0) {
byte[] ba = new byte[4];
ba[0] = tt;
ba[1] = t1[i+1];
ba[2] = t1[i+2];
ba[3] = t1[i+3];
i++;
i++;
i++;
i++;
String result = new String(ba);
System.out.println("4个字节的字符");
System.out.println("字符为:" + result);
}
}
}
}
参考文献:
http://www.yunmx.com/archives/2011/138.htm http://zh.wikipedia.org/wiki/UTF-8
相关文章推荐
- Java字符串找出4个字节长度的字符
- Java字符串找出4个字节长度的字符
- java算法之二直接插入排序(插入排序)
- javaee所需要的使用到的工具。
- 2.深入理解Java:注解(Annotation)--注解处理器
- java之十三篇:java中多线程
- 1.深入理解Java:注解(Annotation)自定义注解入门
- java之十二篇:java搞不定的改用动态库来扛
- java之十一篇:java中关于生命周期
- Java_jdbc 基础笔记之十五 数据库连接(取得数据库自动生成的主键)
- spring project
- java中如何使用任务调度
- Java_jdbc 基础笔记之十四 数据库连接(元数据)
- 使用Maven管理spring环境的profile定义
- Java通过一系列工具打包成不需要JDK支持的exe文件
- JSP:JavaBean+EL函数+JSTL标签
- java数组常用方法
- java之十篇:关于Read time OUt
- java之九篇:外部类、内部类(匿名类)间形成的调用关系
- java 静态代码块 静态方法