Hadoop--学习笔记 在Eclipse中操作远程hdfs文件
2014-04-16 17:09
806 查看
最近在学习Hadoop,总结两点:
1.在运行Mapreduce程序时,设置程序操作hdfs目录而不是本地目录
2.在运行Mapreduce程序时,每次运行程序前都要删除输出目录下文件名相同的文件,不然就会提示“Exception in thread "main" org.apache.hadoop.mapred.FileAlreadyExistsException: Output directory hdfs://localhost:8020/output/heyu1 already exists”的错误,在网上找了半天也没找到好的解决办法,最后在看《Hadoop实战》时发现源程序里有个类FileSystem,于是尝试了一下果然成功了。
添加代码如下
1.在运行Mapreduce程序时,设置程序操作hdfs目录而不是本地目录
2.在运行Mapreduce程序时,每次运行程序前都要删除输出目录下文件名相同的文件,不然就会提示“Exception in thread "main" org.apache.hadoop.mapred.FileAlreadyExistsException: Output directory hdfs://localhost:8020/output/heyu1 already exists”的错误,在网上找了半天也没找到好的解决办法,最后在看《Hadoop实战》时发现源程序里有个类FileSystem,于是尝试了一下果然成功了。
添加代码如下
//设置操作文件地址为 hdfs 的地址 FileSystem.setDefaultUri(conf, "hdfs://localhost:8020"); FileSystem fs = FileSystem.get(conf); //如果输出目录存在则删除 fs.delete(new Path("/output/heyu1"), true); FileOutputFormat.setOutputPath(conf, new Path("/output/heyu1"));
相关文章推荐
- [hadoop学习笔记] 之 eclipse插件操作hdfs出现的权限问题
- Hadoop学习笔记一(通过Java API 操作HDFS,文件上传、下载)
- Hadoop学习笔记0002——HDFS文件操作
- hadoop学习笔记(HDFS的文件操作)
- Hadoop学习笔记之在Eclipse中远程调试Hadoop
- hadoop学习之HDFS(2.5):windows下eclipse远程连接linux下的hadoop集群并测试wordcount例子
- Spark Hadoop集群部署与Spark操作HDFS运行详解---Spark学习笔记10
- Hadoop学习笔记(3)-java操作hdfs的API接口
- hadoop2.5.2学习及实践笔记(五)—— HDFS shell命令行常见操作
- Hadoop学习笔记(九):如何在windows上使用eclipse远程连接hadoop进行程序开发
- 安装、进程-云计算学习笔记---hadoop的简介,以及安装,用命令实现对hdfs系统进行文件的上传下载-by小雨
- 【hadoop】Hadoop学习笔记(九):如何在windows上使用eclipse远程连接hadoop进行程序开发
- Hadoop2.4.1学习笔记(二)之hdfs文件系统学习
- Hadoop学习笔记 6 - eclipse远程连接Hadoop
- hadoop学习;大数据集在HDFS中存为单个文件;安装linux下eclipse出错解决;查看.class文件插件
- hadoop学习;大数据集在HDFS中存为单个文件;安装linux下eclipse出错解决;查看.class文件插件
- Hadoop学习笔记———《读、写HDFS文件》
- Hadoop学习<二>--HDFS文件系统操作方式
- Hadoop学习笔记_操作篇之一:HDFS操作
- Hadoop学习笔记——1.java读取Oracle中表的数据,创建新文件写入Hdfs