hadoop日志分析系统一 Hadoop的认识
2018-02-26 17:35
218 查看
Hadoop是一个分布式的大数据处理平台核心组成: HDFS分布式文件系统:高度容错的分布式文件存储系统MapReduce并行计算模型:一种计算的模型Common组件:hadoop的核心组件其它组件: HBase:高可靠性、高性能、面向列、可伸缩的分布式存储系统Hive:数据仓库Sqoop:结构化数据与hadoop管理的数据进行转换ZooKerper:负责整个hadoop系统的协调,如统一命名、状体同步服务 核心思想:人多力量大,通过把大任务拆分成小任务进行执行,最后分析汇总设计思路:数据的存放和处理在同一台机器上,使用数据流的方式处理数据框架特点:方便、弹性、健壮、简单使用领域:半结构化或者非结构化的数据的分析处理
相关文章推荐
- hadoop日志分析系统一 Hadoop的认识
- hadoop日志分析系统二 第一部分 利用任务调度系统定期的把web系统所产生的日志文件导入到hdfs中
- hadoop学习笔记(九)——hadoop日志分析系统
- hadoop日志分析系统二 第二部分利用hadoop平台进行数据处理 第一种方式 mapreduce方式
- hadoop日志分析系统二 第二部分利用hadoop平台进行数据处理 第二中种方式 mapreduce方式
- hadoop日志分析系统二 第二部分利用hadoop平台进行数据处理 第三种方式 hive+sqoop+zookeeper方式
- hadoop日志分析系统三 最终通过Web接口与用户交互
- Hadoop日志分析系统启动脚本
- hadoop日志分析系统二 第一部分 利用任务调度系统定期的把web系统所产生的日志文件导入到hdfs中
- Hadoop日志文件分析系统
- hadoop状态分析系统chukwa (日志收集存储分析系统)
- hadoop日志分析系统二 第二部分利用hadoop平台进行数据处理 第一种方式 mapreduce方式
- Hadoop日志分析系统
- Hadoop日志文件分析系统
- hadoop日志分析系统二 第二部分利用hadoop平台进行数据处理 第二中种方式 mapreduce方式
- hadoop日志分析系统二 第二部分利用hadoop平台进行数据处理 第三种方式 hive+sqoop+zookeeper方式
- hadoop日志分析系统
- seci-log 1.05 发布,日志分析增加业务系统日志
- fluentd结合kibana、elasticsearch实时搜索分析hadoop集群日志
- ELK6.2.2日志分析监控系统搭建和配置