您的位置:首页 > 运维架构

Hadoop 实现Writable接口

2016-01-10 22:30 302 查看
MapReduce 里的键值对必须实现可序列化,以支持在网络中传输。

值必须实现 Writable接口,而键因为在Reduce阶段有排序任务,所以必须实现WritableComparable<T> 接口。



现在想自定义数据类型,则自己写类来实现WC<T>接口即可。

Writable接口有两个函数



write是序列化函数,即向其他人传送类时使用,readFields则在接受此类时调用来反序列化。

参数DataInput和DataOutput是Java中的接口。

DataOutput
接口用于将任意 Java 基本类型转换为一系列字节,并将这些字节写入二进制流。

下图为DataOutput的方法。这里已经定义了基本类型的序列化,而我们要做的是把类做序列化。



import java.io.DataInput;
import java.io.DataOutput;
import java.io.IOException;

import org.apache.hadoop.io.WritableComparable;

public class Edge implements WritableComparable<Edge>{
private String FromNode;  // 出发地
private String ToNode;     // 目的地
@Override
public void readFields(DataInput in) throws IOException {
FromNode = in.readUTF();
ToNode = in.readUTF();
}
@Override
public void write(DataOutput out) throws IOException {
out.writeUTF(FromNode);
out.writeUTF(ToNode);
// out 可直接写入二进制流
}
@Override
public int compareTo(Edge i) {
return (FromNode.compareTo(i.FromNode)!=0)
?FromNode.compareTo(i.FromNode)
:ToNode.compareTo(i.ToNode);
//按出发地的字典序排列,如果相同则按照目的地的字典序排列。
}

}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: