您的位置:首页 > 其它

IO

2015-08-03 02:48 281 查看


IO

Java中,可以从其中读入一个字节序列的对象叫做输入流,可以向其中写入一个字节序列的对象叫做输出流。字节序列的来源和目的地可以是文件,也可以是网络连接和内存块。抽象类InputStream和OutputStream是字节流类的基础。

从抽象类Reader和Writer中继承出来的类用来处理Unicode的字符。一个字符是两个字节。

InputStream和OutputStream

InputStream方法:

int read(),读入一个字节,返回读入的该字节,遇到输入源结尾返回-1.

int read(byte[] b),读入一个字节数组,返回实际读入的字节数。

int read(byte[] b, int off, int len)

long skip(long n),在输入流中跳过n个字节,返回实际跳过的字节数(如果碰到流的结尾,可能小于n)。

int available(),返回在不阻塞的情况下可用的字节数

read方法和OutputStream的write方法在执行时都将阻塞,直至字节确实被读入或写出。这样如果流不能被立即访问(网络原因),那么当前的线程就将阻塞。使得这个方法等待指定的流变为可用的这段时间里,其它的线程就有机会去执行有用的工作。

因此,使用available方法使我们去检查当前可用于读入的字节数量,下面这样的代码就不可能被阻塞。

?
当完成对流的读写时,调用close关闭,否则系统资源可能被耗尽。关闭一个输出流的同时也是在清空用于该输出流的缓冲区,如果不关闭文件,那么写出字节的最后一个包可能永远得不到传递,也可以调用flush方法人为清空输出。

OutputStream方法:

void write(int n),写出一个字节的数据

void write(byte[] b)

void write(byte[] b, int off, int len)

void flush(),清空输出流,即将所有缓冲的数据发送到目的地。

组合流过滤器

FileInputStream和FileOutputStream提供了对文件上的输入输出流。但是不能对数字进行单独的读写。

DataInputStream和DataOutputStream有读写数字类型的方法,如:

?
如果要想从文件中读取数字,就可以把这两种流组合起来。如下:

?
可以通过嵌套来添加多重的功能,如,流在默认情况下不被缓冲区缓存的,即每个对read的调用都会请求操作系统在分发一个字节。相比之下,请求一个数据块并将其至于缓冲区中会更高效,如果要使用缓冲区,可以使用下面方式:

?
PushbackInputStream

当多个流连接在一起,需要跟踪各个中介流(intermediate stream)。当读入输入时,需要浏览下一个字节,来判断是否是想要的值。此时可以使用PushbackInputStream。

?
现在可以预读入下一个字节,如果不是想要的,可以将其抛回。

?
如果既需要可回退(pushback)输入流的方法,又可以预先浏览,还可以读入数字,可以再包装一层DataInputStream

?
文本输入和输出

InputStreamReader类将包含字节(某种字符编码方式表示的字符)的输入流转会为可以产生Unicode字符的读入器。

OuputStreamWriter类将使用选定的字符编码方式,把Unicode字符流转换为字节流。

以二进制格式写出数据,使用DataOutputStream

以文本格式写出数据,使用PrintWriter。

在Java1.5之前,处理文本输入的唯一方式是通过BufferedReader类,一般情况如下:

?
但是BufferedReader没有任何用于读入数字的方法,因此建议使用Scanner来读入文本输入。Scanner是一个使用正则表达式来解析基本数据类型和字符的文本扫描器,扫描对象可以是字符串,文件,文件流等。

典型应用如下:

?
注意:当想要一行一行读数据时,用nextLine(),当使用nextInt()类似的时候,再此要读下一行的int数据时,先使用nextLine(),使之到下一行。

编码和解码

Charset类使用的是由IANA字符集注册中心标准化的字符集名字。可以调用静态方法forName来获得一个Charset。
?
读写二进制数据

DataOutput接口定义了下面用于以二进制格式写数组、字符、boolean值和字符串的方法:

writeChars writeByte writeUTF writeChar writeDouble…

例如,writeInt总是将一个整数写出为4字节的二进制数量值,不管它有多少位,writeDouble将一个double值写出为8字节的二进制数量值。虽然二进制结果非人可阅读的,但是对于给定类型的每个值,所需的空间相同,将其读回也比解析文本要更快。

DataOutput接口的实现类有DataOutputStream。

DataInput类用于读回数据,相应有一下方法

readInt readShort readLong readUTF

DataInput接口常用的实现类有DataInputStream。

随机访问文件RandomAccessFile

RandomAccessFile类可以在文件中的任何位置查找或写入数据。磁盘文件都是随机访问的,但是从网络上来的数据流不是。用法一般如下:

?
同时RandomAccessFile类实现了DataInput和DataOutput接口,可以使用readInt,writeDouble等方法。

Zip文档

ZipInputStream和ZipOutputStream是Zip压缩文件的输入流和输出流,Zip压缩包中每个文件是ZipEntry。常用方法为:
?
与Zip文件相关还有ZipFile,用来表示一个Zip文件。常用方法
void close()
关闭 ZIP 文件。
Enumeration<? extends ZipEntry> entries()
返回 ZIP 文件条目的枚举。
protected void finalize()
确保不再引用此 ZIP 文件时调用它的 close 。
ZipEntry getEntry(String name)
返回指定名称的 ZIP 文件条目;如果未找到,则返回 null。
InputStream getInputStream(ZipEntry entry)
返回输入流以读取指定 ZIP 文件条目的内容。
String getName()
返回 ZIP 文件的路径名。
int size()
返回 ZIP 文件中的条目数。
对象序列化

作用:

1. 把对象的字节序列保存到硬盘上,通常放在一个文件中

2. 在网络上传送对象的字节序列

对象流ObjectInputStream和ObjectOutputStream

调用readObject()和writeObject(Object),但是对象的类必须实现Serializable接口或者Externalizable接口,后者继承自前者,实现后者的类可以完全由自身来控制序列化行为,前者按照JDK默认方式。

如果继承Serializable接口的类,且自身定义了writeObject(ObjectOuputStream)和readObject(ObjectInputStream)方法,则ObjectOutputStream调用该类的writeObject方法来进行序列化,ObjectInputStream调用readObject来进行反序列化。

注意:writeObject和readObject方法并不是在Serializable接口中定义的。

而实现Externallizable接口的类,必须实现readExternal(ObjectInput in)和writeExternal(ObjectOutput out),ObjectOutputStream调用该类的writeExternal来进行序列化,ObjectInputStream先通过该类的无参构造函数创建一个对象,然后调用它的readExternal方法来进行反序列化。注意:无参的构造函数必须是公开的。否则会抛出InvalidClassException

注意:使用序列化方式发送同一个对象,接收的时候,用==判断为true,因为是同一个对象。

如果对象中有的属性不想要被序列化,则用transient修饰符修饰。例子如下:

?
如果即想要序列化,又考虑安全问题,如密码 password 属性,可以使用加密的方式来序列化,首先 password 属性也设为 transient 。

?
注意:默认的序列化方式会序列化整个对象图,如 Manager 类有一个属性 Employee 类的对象,则序列化 Manager 类对象的时候也会序列化 Employee 属性,而如果同时 Employee 类也有其它实现了 Serializable 接口的对象,也会一起序列化。需要 递归遍历对象图。如果对象图很复杂,需要消耗很多空间和时间,甚至会导致内存溢出。

因此在复杂的对象图中,使用transient修饰符,并定义writeObject和readObject方法。

单例模式序列化会违背单例只有一个实例的初衷,如下:

?
运行结果为 false ,证明出现了 Singleton 类的两个实例。

可以在Singleton类中添加一个方法readResolve(),如下
private Object readResolve() {

return instance;

}
readResolve方法用来重新指定反序列化得到的对象,与此对应的是writeReplace用来指定被序列化的对象,方法返回一个Object对象,这个对象才是真正要被序列化的对象。

实现Externalizable接口例子:

?
对象流一般还用来做对象的深拷贝

?
File类

mkdir()方法,创建一个由这个File对象给定名字的子目录,成功返回true

mkdirs()方法,与mkdir不同,这个方法在必要时将创建父目录。

FilenameFilter接口,可以用来根据文件名来过滤文件。用法如下:

?
内存映射文件

大部分操作系统可以利用虚拟内存将一个文件或者文件的一部分“映射”到内存中,这样可以把文件当作是内存数组一样访问,速度快很多。一个比较大的文件的时间对比如下:
方法
时间
随机访问文件
162s
普通输入流
110s
带缓冲的输入流
9.9s
内存映射文件
7.2s
一般步骤如下:

1. 从文件中获得一个通道Channel,通道是用于磁盘文件的一种抽象,使我们可以访问诸如内存映射、文件加锁机制以及文件间快速数据传递等操作系统特性。可以调用FileInputStream、FileOutputStream和RandomAccessFile类的getChannel方法来得到。

2. 调用FileChannel类的map方法从通道中获得一个MappedByteBuffer。可以指定想要映射的文件区域和映射模式,支持三种模式:

a) FileChannel.MapMode.READ_ONLY:缓冲区是只读的

b) FileChannel.MapMode.READ_WRITE:缓冲区是可写的,任何修改都会在某个时候写回到文件中。

c) FileChannel.MapMode.PRIVATE:缓冲区是可写的,但是任何修改对这个缓冲区来说都是私有的,不会传播到文件中。

3. 有了缓冲区,可以使用ByteBuffer类和Buffer超类的方法读写数据了。缓冲区支持顺序和随机数据访问,可以通过get和put操作来推动的位置。

一般代码如下:

?
在java.util.zip包下有CRC32类,用来计算文件的32位循环冗余校验和,这个数值经常用来判断一个文件是否已损坏,因为文件的损坏可能导致校验和改变,方法为:

?
使用BufferedInputStream检验:
InputStream is = new BufferedInputStream(new FileInputStream(filename));
RandomAccessFile校验:

?
使用FileChannel:
?
缓冲区数据结构

Buffer类是一个抽象类,子类包括ByteBuffer、CharBuffer、DoubleBuffer、IntBuffer、LongBuffer和ShortBuffer。

注意:StringBuffer与这些缓冲区没关系。

每个缓冲区都有:

1. 容量,值是固定的

2. 读写位置,下一个值将在此进行读写

3. 界限,超过它进行读写是没有意义的

4. 可选的标记,用于重复一个读入或写出操作。

这些值满足:0≤标记≤位置≤界限≤容量
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: