您的位置:首页 > 大数据

大数据技术之Hadoop

2016-05-03 22:52 951 查看
大数据技术之Hadoop-----> 未完,待续

到官网下载 hadoop-2.5.2.tar.gz ,解压到没有中文的路径下

配置环境变量 HADOOP_HOME

配置Path 路径 %HADOOP_HOME%/bin ;%HADOOP_HOME%/sbin

1.对hdfs的操作方式:hadoop fs xxx

hadoop fs -ls / 查看hdfs的根目录下的内容的

hadoop fs -lsr / 递归查看hdfs的根目录下的内容的

hadoop fs -mkdir /d1 在hdfs上创建文件夹d1

hadoop fs -put <linux source> <hdfs destination> 把数据从linux上传到hdfs的特定路径中

hadoop fs -get <hdfs source> <linux destination> 把数据从hdfs下载到linux的特定路径下

hadoop fs -text <hdfs文件> 查看hdfs中的文件

hadoop fs -rm 删除hdfs中文件

hadoop fs -rmr 删除hdfs中的文件夹

hadoop fs -ls hdfs://hadoop0:9000/

2.HDFS的datanode在存储数据时,如果原始文件大小>64MB,按照64MB大小切分;如果<64MB,只有一个block,占用磁盘空间是源文件实际大小。

3.RPC(remote procedure call)

不同java进程间的对象方法的调用。

一方称作服务端(server),一方称作客户端(client)。

server端提供对象,供客户端调用的,被调用的对象的方法的执行发生在server端。

RPC是hadoop框架运行的基础。

4.通过rpc小例子获得的认识?

4.1 服务端提供的对象必须是一个接口,接口extends VersioinedProtocal

4.2 客户端能够的对象中的方法必须位于对象的接口中。

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: