您的位置:首页 > 编程语言 > Java开发

java中char和byte的转换

2015-10-30 15:35 876 查看
首先,byte[]是字节数组类型,和int[]类似,只是一个是字节型的,一个是整型的;

char是UNICOEDE字符,为16位的整数;

String是个类,一般用来表示字符串的;

hello.getBytes()意思就是把hello这个字符串转化为字节流(byte型);一般前面加个byte[]型的变量,就是把转化后的字节流放到这个变量里,如下:

byte[] bt=hello.getBytes();

// char转byte

private byte[] getBytes (char[] chars) {

Charset cs = Charset.forName ("UTF-8");

CharBuffer cb = CharBuffer.allocate (chars.length);

cb.put (chars);

cb.flip ();

ByteBuffer bb = cs.encode (cb);

return bb.array();

}

// byte转char

private char[] getChars (byte[] bytes) {

Charset cs = Charset.forName ("UTF-8");

ByteBuffer bb = ByteBuffer.allocate (bytes.length);

bb.put (bytes);

bb.flip ();

CharBuffer cb = cs.decode (bb);

return cb.array();

}



在NIO中,数据的读写操作始终是与缓冲区相关联的.读取时信道(SocketChannel)将数据读入缓冲区,写入时首先要将发送的数据按顺序填入缓冲区.缓冲区是定长的,基本上它只是一个列表,它的所有元素都是基本数据类型.ByteBuffer是最常用的缓冲区,它提供了读写其他数据类型的方法,且信道的读写方法只接收ByteBuffer.

1.创建ByteBuffer

1.1 使用allocate()静态方法

ByteBuffer buffer=ByteBuffer.allocate(256);

以上方法将创建一个容量为256字节的ByteBuffer,如果发现创建的缓冲区容量太小,唯一的选择就是重新创建一个大小合适的缓冲区.

1.2 通过包装一个已有的数组来创建

如下,通过包装的方法创建的缓冲区保留了被包装数组内保存的数据.

ByteBuffer buffer=ByteBuffer.wrap(byteArray);

如果要将一个字符串存入ByteBuffer,可以如下操作:

String sendString="你好,服务器. ";

ByteBuffer sendBuffer=ByteBuffer.wrap(sendString.getBytes("UTF-16"));

2.回绕缓冲区

buffer.flip();

这个方法用来将缓冲区准备为数据传出状态,执行以上方法后,输出通道会从数据的开头而不是末尾开始.回绕保持缓冲区中的数据不变,只是准备写入而不是读取.

3.清除缓冲区

buffer.clear();

这个方法实际上也不会改变缓冲区的数据,而只是简单的重置了缓冲区的主要索引值.不必为了每次读写都创建新的缓冲区,那样做会降低性能.相反,要重用现在的缓冲区,在再次读取之前要清除缓冲区.

4.从套接字通道(信道)读取数据

int bytesReaded=socketChannel.read(buffer);

执行以上方法后,通道会从socket读取的数据填充此缓冲区,它返回成功读取并存储在缓冲区的字节数.在默认情况下,这至少会读取一个字节,或者返回-1指示数据结束.

5.向套接字通道(信道)写入数据

socketChannel.write(buffer);

此方法以一个ByteBuffer为参数,试图将该缓冲区中剩余的字节写入信道.

-----------------------

ByteBuffer俗称缓冲器, 是将数据移进移出通道的唯一方式,并且我们只能创建一个独立的基本类型缓冲器,或者使用“as”方法从 ByteBuffer 中获得。ByteBuffer 中存放的是字节,如果要将它们转换成字符串则需要使用 Charset , Charset 是字符编码,它提供了把字节流转换成字符串 ( 解码 ) 和将字符串转换成字节流 ( 编码) 的方法。

private byte[] getBytes (char[] chars) {//将字符转为字节(编码)

Charset cs = Charset.forName ("UTF-8");

CharBuffer cb = CharBuffer.allocate (chars.length);

cb.put (chars);

cb.flip ();

ByteBuffer bb = cs.encode (cb)

return bb.array();

}

private char[] getChars (byte[] bytes) {//将字节转为字符(解码)

Charset cs = Charset.forName ("UTF-8");

ByteBuffer bb = ByteBuffer.allocate (bytes.length);

bb.put (bytes);

bb.flip ();

CharBuffer cb = cs.decode (bb);

return cb.array();

}

通道也就是FileChannel,可以由FileInputStream,FileOutputStream,RandomAccessFile三个类来产生,例如:FileChannel fc = new FileInputStream().getChannel();与通道交互的一般方式就是使用缓冲器,可以把通道比如为煤矿(数据区),而把缓冲器比如为运煤车,想要得到煤一般都通过运煤车来获取,而不是直接和煤矿取煤。用户想得到数据需要经过几个步骤:

一、用户与ByteBuffer的交互

向ByteBuffer中输入数据,有两种方式但都必须先为ByteBuffer指定容量

ByteBuffer buff = ByteBuffer.allocate(BSIZE);

a) buff = ByteBuffer.wrap("askjfasjkf".getBytes())注意:wrap方法是静态函数且只能接收byte类型的数据,任何其他类型的数据想通过这种方式传递,需要进行类型的转换。

b) buff.put();可以根据数据类型做相应调整,如buff.putChar(chars),buff.putDouble(double)等

二、FileChannel 与 ByteBuffer的交互:

缓冲器向通道输入数据

FileChannel fc = new FileInputStream().getChannel();

fc.write(buff);

fc.close();

三、 用户与ByteBuffer交互

通道向缓冲器送入数据

FileChannel fc = new FileOutputStream().getChannel();

fc.read( buff);

fc.flip();

四、呈现给用户(三种方式)

1)String encoding = System.getProperty("file.encoding");

System.out.println("Decoded using " + encoding + ": " + Charset.forName(encoding).decode(buff));

2)System.out.println(buff.asCharBuffer());//这种输出时,需要在输入时就进行编码getBytes("UTF-8")

3) System.out.println(buff.asCharBuffer());//通过CharBuffer向ByteBuffer输入 buff.asCharBuffer().put。

fc.rewind();


API


API CharBuffer


java.nio


类 CharBuffer

java.lang.Object


java.nio.Buffer


java.nio.CharBuffer


所有已实现的接口:Appendable, CharSequence, Comparable<CharBuffer>, Readable

字符缓冲区。

此类定义了字符缓冲区上的四类操作:

读写单个字符的绝对和相对 get 和 put 方法;

将此缓冲区中的连续字符序列传输到数组中的相对批量 get 方法;

将字符数组、字符串或其他字符缓冲区中的连续字符序列传输到此缓冲区的相对批量 put 方法;以及

字符缓冲区的 compacting、duplicating 和 slicing 方法。

字符缓冲区可以通过 allocation 方法创建,此方法通过 wrapping 将一个现有字符数组或字符串包装到缓冲区中来为缓冲区内容分配空间,或者通过创建现有字节缓冲区的视图来创建。

像字节缓冲区一样,字符缓冲区要么是直接的,要么是非直接的。通过此类的 wrap 方法创建的字符缓冲区将是非直接的。当且仅当字节缓冲区本身为直接时,作为字节缓冲区的视图创建的字符缓冲区才是直接的。通过调用 isDirect 方法可以确定字符缓冲区是否为直接的。

此类实现 CharSequence 接口,以便字符缓冲区可以用于任何接受字符序列的地方,例如,在正则表达式包 java.util.regex 中。

将ByteBuffer转换成CharBuffer的两种方式:

byteBuffer.asCharBuffer() 默认以 UTF-16BE 来编码

Charset.forName("XX").decode(byteBuffer) 转换前可指定编码方式

不同的机器可能会使用不同的字节排序方法来存储数据。“Big endian(高位优先)”将最高位的字节存入在地址最低的存储器单元。而“Little endian(低位优先)”将最高位的字节存放在地址最高的存储器单元。当存储量大于一个字节时,像int,float等,我们就要考虑字节的顺序问题了。初建的ByteBuffer默认是以Big endian的形式存储数据的,并且数据在网上传送时也常常使用Big
endian形式。我们可以使用带参数的order(ByteOrder bo) 来修改字节序成ByteOrder.BIG_ENDIAN或ByteOrder.LITTLE_ENDIAN。

big endian:最高字节在地址最低位,最低字节在地址最高位,依次排列。

little endian:最低字节在最低位,最高字节在最高位,反序排列。

Big Endian

低地址 高地址

----------------------------------------->

+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

| 12 | 34 | 56 | 78 |

+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

Little Endian

低地址 高地址

----------------------------------------->

+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

| 78 | 56 | 34 | 12 |

+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

如果我们将0x1234abcd写入到以0x0000开始的内存中,则结果为

big-endian little-endian

0x0000 0x12 0xcd

0x0001 0x34 0xab

0x0002 0xab 0x34

0x0003 0xcd 0x12

为什么要注意字节序的问题呢?你可能这么问。当然,如果你写的程序只在单机环境下面运行,并且不和别人的程序打交道,那么你完全可以忽略字节序的存在。但是,如果你的程序要跟别人的程序产生交互呢?在这里我想说说两种语言。C/C++语言编写的程序里数据存储顺序是跟编译平台所在的CPU相关的,而JAVA编写的程序则唯一采用big endian方式来存储数据 。试想,如果你用C/C++语言在x86平台下编写的程序跟别人的JAVA程序互通时会产生什么结果?就拿上面的0x12345678来说,你的程序传递给别人的一个数据,将指向0x12345678的指针传给了JAVA程序,由于JAVA采取big
endian方式存储数据,很自然的它会将你的数据翻译为0x78563412。什么?竟然变成另外一个数字了?是的,就是这种后果。因此,在你的C程序传给JAVA程序之前有必要进行字节序的转换工作 。

所有网络协议也都是采用big endian的方式来传输数据的。所以有时我们也会把big endian方式称之为网络字节序 。当两台采用不同字节序的主机通信时,在发送数据之前都必须经过字节序的转换成为网络字节序后再进行传输 。

Java代码


import java.io.FileInputStream;

import java.io.FileOutputStream;

import java.io.IOException;

import java.io.UnsupportedEncodingException;

import java.nio.ByteBuffer;

import java.nio.channels.FileChannel;

import java.nio.charset.Charset;

public class BufferToText {

public static void main(String[] args) {

try {

//--以系统默认编码方式写文件

FileChannel fc = new FileOutputStream("data2.txt").getChannel();

fc.write(ByteBuffer.wrap("测试字符".getBytes()));

fc.close();

//--读文本

fc = new FileInputStream("data2.txt").getChannel();

ByteBuffer buff = ByteBuffer.allocate(1024);

fc.read(buff);

buff.flip();

//显示乱码,采用默认的编码方式(UTF-16BE)将ByteBuffer转换成CharBuffer

System.out.println(buff.asCharBuffer());

buff.rewind();//准备重读

//当前系统默认编码方式

String encoding = System.getProperty("file.encoding");

//下面我们使用系统默认的编码方式(GBK)将ByteBuffer转换成CharBuffer

System.out.println("Decoded using " + encoding + ": "

+ Charset.forName(encoding).decode(buff));//显示正常,因为写入与读出时采用相同编码方式

//--或者,先以UTF-16BE编码后再写文件

fc = new FileOutputStream("data2.txt").getChannel();

fc.write(ByteBuffer.wrap("测试字符".getBytes("UTF-16BE")));

fc.close();

// 再尝试读

fc = new FileInputStream("data2.txt").getChannel();

buff.clear();

fc.read(buff);

buff.flip();

//显示正常,可见asCharBuffer()方式是以UTF-16BE解码的

System.out.println(buff.asCharBuffer());

//--也可直接通过CharBuffer写也是可以的

fc = new FileOutputStream("data2.txt").getChannel();

buff = ByteBuffer.allocate(8);//UTF-16编码时每个字符占二字节,所以需四个

//将ByteBuffer转换成CharBuffer后再写

buff.asCharBuffer().put("测试字符");

fc.write(buff);

fc.close();

//读显示

fc = new FileInputStream("data2.txt").getChannel();

buff.clear();

fc.read(buff);

buff.flip();

//同时也采用默认的转换方式asCharBuffer将ByteBuffer转换成CharBuffer

System.out.println(buff.asCharBuffer());//显示正常

} catch (UnsupportedEncodingException e) {

e.printStackTrace();

} catch (IOException e) {

e.printStackTrace();

}

}

}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: