Java unicode中文编码转换和反转
2013-09-19 00:17
197 查看
参考网址http://www.oschina.net/code/snippet_142385_4297
/article/3823709.html
在java的很多配置文件中,尤其是国际化资源中经常遇到类似\uf432这样的unicode编码,搜集了下该编码相关的资料,大致处理方法有如下:
1、Unicode转 汉字字符串。
这个过程最简单的方式就是直接获取。比如
String cnStr = "\ufeff\u4e2d\u56fd\u4eba";
System.out.println(cnStr); 即可获取对应的汉字字符 “中国人”;
但是呢,每次从输出读的话也未免过于不方便了,我们使用方法来做转换,直接获取。
参考如下
2、获取字符串的unicode编码,这个我们可以通过直接获取字符串的unicode二进制,然后将其byte转换成对应的16进制表示即可,函数示例如下
通过上面的方式便可完整的使用unicode编码了,大家有其他方式的转换也可以告诉我下,互相学习
/article/3823709.html
在java的很多配置文件中,尤其是国际化资源中经常遇到类似\uf432这样的unicode编码,搜集了下该编码相关的资料,大致处理方法有如下:
1、Unicode转 汉字字符串。
这个过程最简单的方式就是直接获取。比如
String cnStr = "\ufeff\u4e2d\u56fd\u4eba";
System.out.println(cnStr); 即可获取对应的汉字字符 “中国人”;
但是呢,每次从输出读的话也未免过于不方便了,我们使用方法来做转换,直接获取。
参考如下
public static String unicodeToString(String str) { Pattern pattern = Pattern.compile("(\\\\u(\\p{XDigit}{4}))"); Matcher matcher = pattern.matcher(str); char ch; while (matcher.find()) { ch = (char) Integer.parseInt(matcher.group(2), 16); str = str.replace(matcher.group(1), ch + ""); } return str; }
2、获取字符串的unicode编码,这个我们可以通过直接获取字符串的unicode二进制,然后将其byte转换成对应的16进制表示即可,函数示例如下
static String getUnicode(String s) { try { StringBuffer out = new StringBuffer(""); byte[] bytes = s.getBytes("unicode"); for (int i = 0; i < bytes.length - 1; i += 2) { out.append("\\u"); String str = Integer.toHexString(bytes[i + 1] & 0xff); for (int j = str.length(); j < 2; j++) { out.append("0"); } String str1 = Integer.toHexString(bytes[i] & 0xff); out.append(str1); out.append(str); } return out.toString(); } catch (UnsupportedEncodingException e) { e.printStackTrace(); return null; } }
通过上面的方式便可完整的使用unicode编码了,大家有其他方式的转换也可以告诉我下,互相学习
相关文章推荐
- Java unicode中文编码转换和反转
- java unicode中文编码转换和反转
- Java 中文 Unicode 编码转换
- Java 中文 Unicode 编码转换
- java unicode 编码转换两种方法
- java unicode转码为中文 实例
- java Unicode和中文互转
- java 中文和unicode字符串互相转换(文件需要保存为gbk2312或者asci格式)
- Java中文处理学习笔记——Hello Unicode
- 关于java UTF-8中文与Unicode编码之间转换,以及将浏览器地址栏编码过的中文转换UTF-8形式
- unicode格式转中文java程序
- jsp中中文出现乱码的原因及解决方案(Java中Unicode、编码的理解)
- java unicode编码 中文 转换
- java实现中文,unicode互相转换
- python乱码,python编码,python中文编码转换,python utf-8,python utf8,python unicode
- java 之批量转换url中的中文unicode
- 编码转换(ASCII和Unicode、Unicode和中文相互转换)
- java 将字符串中含有unicode 转成中文
- Java判断中文及中文字符转unicode
- Java的中文处理学习笔记:Hello Unicode