视频教程-Facebook数据查询引擎Presto教程(含配套资料)-大数据
订阅后:请点击此处观看视频课程
视频教程-Facebook数据查询引擎Presto教程(含配套资料)-大数据
学习有效期:永久观看
学习时长:375分钟
学习计划:7天
难度:高
「[strong]口碑讲师带队学习,让你的问题不过夜」 [/strong]
讲师姓名:[strong]张长志 [/strong]
CTO/CIO/技术副总裁/总工程师
讲师介绍:张长志技术全才、擅长领域:区块链、大数据、Java等。10余年软件研发及企业培训经验,曾为多家大型企业提供企业内训如中石化,中国联通,中国移动等知名企业。拥有丰富的企业应用软件开发经验、深厚的软件架构设计理论基础及实践能力。项目开发历程:基于大数据技术推荐系统 ,医疗保险大数据分析与统计推断,H5跨平台APP,携程酒店APP,Go语言实现Storm和ZK类似框架。
☛点击立即跟老师学习☚
「你将学到什么?」
版本:presto-server-0.214.tar
软件版本
presto-cli-0.214-executable
CentOS7
1、presto的起因
hadoop ---hdfs----MR(java)-----hive
hive底层原理用MR,速度比较慢,公司hadoop集群主要集中于晚上到凌晨,平日工作时间负载不是很高。但在工作时间内,公司业务人员有实时查询的需求,现在主要借助于hive提供业务人员的查询。hive是基于MR类的SQL查询工具,他会输入的查询SQL解析为MapReduce,能极大的降低使用大数据门槛,让一般的业务人员可以直接准对大数据进行查询,但是有一个利弊,它的查询基于MR,会让人等待比较着急,等待的时间可能是几个小时或者一天。 spark基于内存提高改良的hive,sql,现在factbook在hive上面开发一套利器,准对hive可以通过sql语句快速查询,presto。
2、Facebook为何开发Presto
Facebook的2011的数据仓库存储在少量大型hadoop
fs集群,Hive是FaceBook在几年前专门为Hadoop打造的一款数据仓库工具,在以前,facebook的科学家和分析师一直靠hive进行数据分析.但hive使用MR作为底层计算框架,是专为批处理设计的,但是随着数据的不断增多,使用hive进行一个简单的数据查询可能要花费分钟或者几个小时,显然不能满足查询需求,FaceBooke也调研了其他比hive更快的工具,但是他们需要在功能有限的条件下做简单操作,以至于无法操作Facebook庞大的数据要求。
2012年开始研究自己的框架--presto,每日可以超过1pb查询,而且速度比较快,faceBook声称Presto的性能比hive要好上10倍或者100倍,presto和hive都是facebook开发的
Presto是一个开源的分布式SQL查询引擎,适用于交互式查询,数据量支持GB到PB字节。
Presto的设计和编写完全是为了解决Facebook这样规模的商业数据仓库交互式分析和处理速度的问题
Presto可以做什么
Presto支持在线数据查询,包括Hive kafka Cassandra关系数据库以及专门数据存储,一条Presto查询可以将多个数据源进行合并,可以跨越整个组织进行分析。
Presto以分析师的需求作为目标,他们期望相应速度小于1秒到几分钟,Presto要么在使用速度的快的昂贵的商业方案,提高内存,要么是消耗大量的硬件进行快速查询。(128G 64G)
「课程学习目录」
1.01.presto的起因 |
2.02.facebook为何要开发presto |
3.03.presto的架构图 |
4.04.presto简介 |
5.05.presto的安装需求 |
6.06.presto的需要安装的软件 |
7.07:VM的安装 |
8.08.centos的安装和网络配置 |
9.09.通过第三方连接centos的方法 |
10.10.CentOS的yum源更新已经关闭防火墙 |
11.11.JAVA的安装和hadoop安装 |
12.12.完全分布式搭建(上) |
13.13.完全分布式搭建(下) |
14.14.通过hadoop自带的demo运行单词统计 |
15.15.写一个sh脚本,可以通过一台机器控制多台机器 |
16.16.hadoop常用的命令 |
17.17.maven的安装 |
18.18.maven使用时出现问题以及解决问题方法 |
19.19.MAPREDUCE 示例编写及编程规范 |
20.20.安装时间同步工具,让所有电脑进行同步 |
21.21.Hive简介和工作流程 |
22.22.数据库安装,centos7安装mysql注意点 |
23.23.安装Hive,并且使用Hive做一个小案例 |
24.24.把txt文件的数据导入到Hive表中 |
25.25.xshell的使用教程 |
26.26.presto的安装过程 |
27.27.presto的运行错误的解决方法 |
28.28.hive和presto的开启 |
29.29.hive和presto的小demo验证 |
30.30.presto的配置文件的讲解 |
31.31.presto的集群的配置演示 |
32.32.presto的集群的启动过程 |
33.33.presto的集群的管理页面的介绍 |
34.34.presto和impala性能对比 |
35.35.案例一通过jdbc方式获取hive数据库的表 |
36.36.案例二通过jdbc方式获取hive数据 |
「[strong]7项超值权益,保障学习质量」 [/strong]
- 大咖讲解
技术专家系统讲解传授编程思路与实战。
- 答疑服务
专属社群随时沟通与讲师答疑,扫清学习障碍,自学编程不再难。
- 课程资料+课件
超实用资料,覆盖核心知识,关键编程技能,方便练习巩固。(部分讲师考虑到版权问题,暂未上传附件,敬请谅解)
- 常用开发实战
企业常见开发实战案例,带你掌握Python在工作中的不同运用场景。
- 大牛技术大会视频
2019Python开发者大会视频免费观看,送你一个近距离感受互联网大佬的机会。
- APP+PC随时随地学习
满足不同场景,开发编程语言系统学习需求,不受空间、地域限制。
「什么样的技术人适合学习?」
- 想进入互联网技术行业,但是面对多门编程语言不知如何选择,0基础的你
- 掌握开发、编程技术单一、冷门,迫切希望能够转型的你
- 想进入大厂,但是编程经验不够丰富,没有竞争力,程序员找工作难。
「悉心打造精品好课,[strong]7天学到大牛3年项目经验」 [/strong]
【完善的技术体系】
技术成长循序渐进,帮助用户轻松掌握
掌握大数据知识,扎实编码能力
【清晰的课程脉络】
浓缩大牛多年经验,全方位构建出系统化的技术知识脉络,同时注重实战操作。
【仿佛在大厂实习般的课程设计】
课程内容全面提升技术能力,系统学习大厂技术方法论,可复用在日后工作中。
「你可以收获什么?」
1.掌握presto的使用和操作,胜任企业的开发应用场景
2.掌握Presto技术在企业中如何使用
订阅课程 开始学习
- Facebook 正式开源其大数据查询引擎 Presto
- Facebook 正式开源其大数据查询引擎 Presto
- Presto Facebook 开源的大数据查询引擎
- Presto 来自Facebook的开源分布式查询引擎
- PrestoDB 大数据查询引擎
- Presto 来自Facebook的开源分布式查询引擎
- 数据仓库(十二)---分布式SQL查询引擎---teradata版本的presto安装和使用
- 大数据SQL交互查询 presto/spark/mapreduce 计算引擎对比
- Presto:Facebook的分布式SQL查询引擎
- Presto | 分布式大数据SQL查询引擎
- 分布式大数据sql查询引擎Presto初识
- Presto 来自Facebook的开源分布式查询引擎
- 下载数据CityEngine示例数据(Tutorial)配套视频教程(英文)
- 【备忘】2017年最新【不走冤枉路】之Java web开发工程师成长之路全套视频教程附配套资料
- Presto 来自Facebook的开源分布式查询引擎
- 视频教程-大规模数据处理计算引擎Spark2.x教程(含资料)-Spark
- J2EE入门视频教程第五讲——MySQL中的数据类型及命令行基本查询语句
- 25数据查询的各种小玩法-select上(必学)-天轰穿sqlserver视频教程
- Presto 来自Facebook的开源分布式查询引擎
- 数据仓库(十)---分布式SQL查询引擎---presto安装部署和连接hive使用