Hadoop 基本API 使用 -- 从HDFS文件系统 上读取文件
2017-03-27 13:49
555 查看
Hadoop 基本API 使用 从HDFS文件系统 上读取文件
不多说 看代码:如果报错 wutils.exe 之类:
请注意一定要添加这一行:
System.setProperty("hadoop.home.dir", "D:\\hadoop-2.7.3");
import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.FileInputStream;
import java.io.FileWriter;
import java.io.InputStreamReader;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FSDataInputStream;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
/**
* 类说明
*
* <pre>
* Modify Information:
* Author Date Description
* ============ =========== ============================
* DELL 2017年3月23日 Create this file
* </pre>
*
*/
public class ReadFromHDFS {
/**
* @param args
* @throws Throwable
*/
public static void main(String[] args) throws Throwable {
String[] ioArg = new String[]{"hdfs://192.168.233.128:9000/user/wangxiaoming/bankstatementconfig/bankstatementconfig.txt"};
String path = ioArg[0];
// String confFile = args[1];
Configuration conf = new Configuration();
// FileInputStream fis = new FileInputStream(confFile);
// conf.addResource(fis);
conf.set("mapred.jop.tracker", "hdfs://192.168.233.128:9001");
conf.set("fs.default.name", "hdfs://192.168.233.128:9000");
System.setProperty("hadoop.home.dir", "D:\\hadoop-2.7.3");
FileSystem fileSystem = FileSystem.get(conf);
FSDataInputStream fs = fileSystem.open(new Path(path));
//GBK
BufferedReader bis = new BufferedReader(new InputStreamReader(fs,"GBK"));
// FileWriter fos = new FileWriter(args[2]);
// BufferedWriter bw = new BufferedWriter(fos);
String temp;
int i=0;
while ((temp = bis.readLine()) != null) {
// bw.write(temp);
System.out.println(temp);
// if(temp.startsWith("</doc>")) {
// break;
// }
// if(temp.indexOf("上海") > -1) {
// System.out.println("发现你了 coming");
// break;
// }
}
// bw.close();
bis.close();
fileSystem.close();
}
}
相关文章推荐
- 使用HDFS API实现hadoop HDFS文件系统的基本操作
- hadoop-3.0.0-beta1运维手册(008):hdfs3.0.0基本操作-查看HDFS文件系统、查看文本文件、使用帮助
- Hadoop学习全程记录——hadoop读取hdfs文件系统里的内容
- Hadoop硬实战之一:使用flume将系统日志文件导入HDFS
- eclipse使用JavaAPI操纵Hadoop的HDFS文件系统时提示权限不足的解决方案
- hadoop一些基本知识——hadoop HDFS文件系统的特征
- 使用Hadoop API操作HDFS文件时遇到的问题及解决总结
- Hadoop (HDFS)分布式文件系统基本操作 推荐
- Hadoop Shell命令(基于linux操作系统上传下载文件到hdfs文件系统基本命令学习)
- Hadoop实验:按规则读取本地文件写入HDFS文件系统
- hadoop系列二:HDFS文件系统的命令及JAVA客户端API
- 使用FileSystem自带的api读取hdfs中的文件
- (9) Hadoop HDFS Java API使用 之 获取FileSystem对象 读取HDFS文件 写文件到HDFS
- hadoop2.7.2学习笔记05-hadoop文件系统API定义-本文档使用到的专用符号
- HDFS的API对Hadoop文件系统的文件进行写入
- 在VMWare Workstation上使用RedHat Linux安装和配置Hadoop群集环境05_HDFS文件系统和Mapreduce框架的启动和运行
- Hadoop实验:按规则读取HDFS文件系统写入到本地
- Hadoop (HDFS)分布式文件系统基本操作
- hadoop文件系统的读取