hadoop支持的数据类型
2013-02-18 21:31
267 查看
mapreduce的过程是:
map:(k1,v1)------list(k2,v2)
reduce:(k2,list(v2))------list(k3,v3)
在map和reduce的过渡阶段,map出的结果中,key相同的数据会被分配到集群中的同一个节点。
(在map与reduce这两个阶段之间还有一个partitioner阶段)
在mapreduce中value的类型必须为Writable类或者WritableComparable<T>接口的子类
key的类型必须为WritableComparable类的子类。
WritableComparable类为Writable和java.lang.Comparable<T>的子类,这是因为key在reduce阶段会被分类,而value只是简单的传递罢了。
一个实例类继承了WritableComparable<T>接口
Edge类有可能代表的是两座城市之间的航线。
map:(k1,v1)------list(k2,v2)
reduce:(k2,list(v2))------list(k3,v3)
在map和reduce的过渡阶段,map出的结果中,key相同的数据会被分配到集群中的同一个节点。
(在map与reduce这两个阶段之间还有一个partitioner阶段)
在mapreduce中value的类型必须为Writable类或者WritableComparable<T>接口的子类
key的类型必须为WritableComparable类的子类。
WritableComparable类为Writable和java.lang.Comparable<T>的子类,这是因为key在reduce阶段会被分类,而value只是简单的传递罢了。
一个实例类继承了WritableComparable<T>接口
import java.io.DataInput; import java.io.DataOutput; import java.io.IOException; import org.apache.hadoop.io.WritableComparable; public class Edge implements WritableComparable<Edge> { private String departureNode; private String arrivalNode; public String getDepartureNode() { return this.departureNode; } @Override public void write(DataOutput out) throws IOException { // TODO Auto-generated method stub out.writeUTF(departureNode); out.writeUTF(arrivalNode); } @Override public void readFields(DataInput in) throws IOException { // TODO Auto-generated method stub departureNode = in.readUTF(); arrivalNode = in.readLine(); } @Override public int compareTo(Edge o) { // TODO Auto-generated method stub return (departureNode.compareTo(o.departureNode) != 0) ? departureNode .compareTo(o.departureNode) : arrivalNode .compareTo(o.arrivalNode); } }
Edge类有可能代表的是两座城市之间的航线。
相关文章推荐
- hadoop 支持的数据类型
- hadoop支持的数据类型
- 大数据学习23:hadoop-2.6.0-cdh5.7.0 编译,支持 native 和 snappy
- AIDL 服务只支持有限的数据类型(转)
- LitJson 不支持 float 类型数据
- 简要介绍TAO支持的IDL数据类型及其C++ Mapping关系
- sqlite 支持的数据类型 全面
- Sqlite3支持的数据类型
- hadoop map reduce自定义数据类型时注意顺序,否则报错。
- 使用的 SQL Server 版本不支持数据类型“date”的解决方法
- Hive支持的数据类型
- 数据类型格式化函数(PostgreSQL),ORACLE支持
- hadoop数据类型
- MySQL所支持的数据类型与表字段约束类型的学习教程
- PostgreSQL json jsonb 支持的value数据类型,如何构造一个jsonb
- C#将数据转换为指定类型,支持对可空类型(Nullable类)转换方法示例
- C#中oracleClient操作空间数据库报“遇到不支持的 Oracle 数据类型 USERDEFINED”
- ef SQL Server 版本不支持数据类型“datetime2”
- PreloadDataCache支持预取的数据缓存,使用简单,支持多种缓存算法,支持不同网络类型,扩展性强
- hadoop特别数据类型介绍