eclipse+hadoop 配置过程中遇到的问题
2016-03-24 15:48
477 查看
1)
首先说下各个工具版本
windows:win7 32位
eclipse: 我用的是String tool Suite3.7.1
hadoop : 2.6.0
虚拟机及linux版本:vmware 和 ubuntu 14.0
2)
搭建过程就不详细说了,,也是找了好多教程。下面附可能有帮助的地址
http://bbs.csdn.net/topics/390684266<span style="font-family: Arial, Helvetica, sans-serif;">CSDN论坛【Hadoop问题汇总贴,不定期更新,欢迎大家推荐有代表性的帖子和博文】</span></h1></span>
http://www.linuxidc.com/Linux/2015-01/112029p2.htm 主要看这部分就可以了 Ubuntu14.04安装配置Hadoop2.6.0(完全分布式)
http://blog.csdn.net/hongweigg/article/details/7185328 Hadoop 解除 "Name node is in safe mode"
http://www.cnblogs.com/xia520pi/archive/2012/05/20/2510723.html Hadoop集群(第7期)_Eclipse开发环境设置
上面的教程差不多就覆盖一些疑惑
3)
eclipse运行wordCount常见错误:1>
org.apache.hadoop.security.AccessControlException: org.apache.hadoop.security.AccessControlException: Permission denied: user=xxx, access=WRITE, inode="xxx":xxx:supergroup:rwxr-xr-x
解决连接:点击打开链接 没有写入权限
2>
Exception in thread "main" java.lang.NullPointerException
这个地方需要注意的是: 需要下载与你windows 版本一致的 .dll 和 .exe 。32位或64位
3>
java.io.IOException: Could not locate executable null\bin\winutils.exe in the Hadoop binaries.
解决办法: 新建系统变量HADOOP_HOME,值是你在windows 上hadoop的路径。。。在Path后面追加上 %HADOOP_HOME%/bin
这样基本就差不多可以跑了。下面附wordCount 代码
package wordCount; import java.io.IOException; import java.util.Iterator; import java.util.StringTokenizer; import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.IntWritable; import org.apache.hadoop.io.LongWritable; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapred.FileInputFormat; import org.apache.hadoop.mapred.FileOutputFormat; import org.apache.hadoop.mapred.JobClient; import org.apache.hadoop.mapred.JobConf; import org.apache.hadoop.mapred.MapReduceBase; import org.apache.hadoop.mapred.Mapper; import org.apache.hadoop.mapred.OutputCollector; import org.apache.hadoop.mapred.Reducer; import org.apache.hadoop.mapred.Reporter; import org.apache.hadoop.mapred.TextInputFormat; import org.apache.hadoop.mapred.TextOutputFormat; /** * * 描述:WordCount explains by Felix * @author Hadoop Dev Group */ public class WordCount { /** * MapReduceBase类:实现了Mapper和Reducer接口的基类(其中的方法只是实现接口,而未作任何事情) * Mapper接口: * WritableComparable接口:实现WritableComparable的类可以相互比较。所有被用作key的类应该实现此接口。 * Reporter 则可用于报告整个应用的运行进度,本例中未使用。 * */ public static class Map extends MapReduceBase implements Mapper<LongWritable, Text, Text, IntWritable> { /** * LongWritable, IntWritable, Text 均是 Hadoop 中实现的用于封装 Java 数据类型的类,这些类实现了WritableComparable接口, * 都能够被串行化从而便于在分布式环境中进行数据交换,你可以将它们分别视为long,int,String 的替代品。 */ private final static IntWritable one = new IntWritable(1); private Text word = new Text(); /** * Mapper接口中的map方法: * void map(K1 key, V1 value, OutputCollector<K2,V2> output, Reporter reporter) * 映射一个单个的输入k/v对到一个中间的k/v对 * 输出对不需要和输入对是相同的类型,输入对可以映射到0个或多个输出对。 * OutputCollector接口:收集Mapper和Reducer输出的<k,v>对。 * OutputCollector接口的collect(k, v)方法:增加一个(k,v)对到output */ public void map(LongWritable key, Text value, OutputCollector<Text, IntWritable> output, Reporter reporter) throws IOException { String line = value.toString(); StringTokenizer tokenizer = new StringTokenizer(line); while (tokenizer.hasMoreTokens()) { word.set(tokenizer.nextToken()); output.collect(word, one); } } } public static class Reduce extends MapReduceBase implements Reducer<Text, IntWritable, Text, IntWritable> { public void reduce(Text key, Iterator<IntWritable> values, OutputCollector<Text, IntWritable> output, Reporter reporter) throws IOException { int sum = 0; while (values.hasNext()) { sum += values.next().get(); } output.collect(key, new IntWritable(sum)); } } public static void main(String[] args) throws Exception { /** * JobConf:map/reduce的job配置类,向hadoop框架描述map-reduce执行的工作 * 构造方法:JobConf()、JobConf(Class exampleClass)、JobConf(Configuration conf)等 */ JobConf conf = new JobConf(WordCount.class); //String[] ars=new String[]{"input","newout"}; //String[] otherArgs = new GenericOptionsParser(conf, ars).getRemainingArgs(); conf.setJobName("wordcount"); //设置一个用户定义的job名称 conf.setOutputKeyClass(Text.class); //为job的输出数据设置Key类 conf.setOutputValueClass(IntWritable.class); //为job输出设置value类 conf.setMapperClass(Map.class); //为job设置Mapper类 conf.setCombinerClass(Reduce.class); //为job设置Combiner类 conf.setReducerClass(Reduce.class); //为job设置Reduce类 conf.setInputFormat(TextInputFormat.class); //为map-reduce任务设置InputFormat实现类 conf.setOutputFormat(TextOutputFormat.class); //为map-reduce任务设置OutputFormat实现类 /** * InputFormat描述map-reduce中对job的输入定义 * setInputPaths():为map-reduce job设置路径数组作为输入列表 * setInputPath():为map-reduce job设置路径数组作为输出列表 */ conf.set("fs.default.name", "hdfs://192.168.20.128:9000"); FileInputFormat.addInputPath(conf, new Path("hdfs://192.168.20.128:9000/dabing/input")); FileOutputFormat.setOutputPath(conf, new Path("hdfs://192.168.20.128:9000/dabing/output")); JobClient.runJob(conf); //运行一个job } }
相关文章推荐
- eclipse+hadoop 配置过程中遇到的问题
- 单机版Hadoop-2.7.3+Hbase-1.3.1,Windows10-eclipse Java Oxygen版本配置及遇到问题总结
- 在hadoop全分布式配置过程中编辑/etc/hosts时遇到权限的问题
- 用Eclipse对Hadoop文件进行压缩和解压缩编译过程中遇到的问题
- Hadoop1.2.1+Zookeeper3.4.5+HBase0.94.18完全分布式集群配置过程中遇到的问题
- 在eclipse中配置好hadoop的插件后使用DFS遇到的问题
- hadoop环境配置过程中可能遇到问题的解决方案
- Eclipse Hadoop配置遇到的问题
- hadoop环境配置过程中可能遇到问题的解决方案
- Hadoop环境配置过程中可能遇到问题的解决方案
- hadoop环境配置过程中可能遇到问题的解决方案
- 配置eclipse maven过程中遇到的问题
- hadoop环境配置过程中可能遇到问题的解决方案
- hadoop eclipse搭建过程中遇到的问题 回顾
- Hadoop 配置-启动 过程中遇到的问题
- hadoop环境配置过程中可能遇到问题的解决方案
- 在lomboz eclipse 3.3中配置tomcat7/8 server运行时环境遇到的问题
- 解决在Eclipse中配置JBoss、Tomcat等插件时遇到的问题
- hadoop伪分布式配置及遇到的问题
- 在Eclipse中配置OpenCV遇到的问题