Apache Kylin 2.0:从Hadoop上的OLAP 引擎到实时数据仓库 [session]
2017-06-08 15:57
295 查看
Strata Data Conference早期门票优惠本周五即将截止!
还有一天,欢迎大家踊跃报名!
点击阅读原文可登录会议网站,尽快报名以确定留位!
Apache Kylin 2.0:从Hadoop上的OLAP 引擎到实时数据仓库
讲师:Dong Li (Kyligence)
11:15–11:55 Saturday, 2017-07-15
数据工程和架构 (Data engineering and architecture)
地点: 紫金大厅B(Grand Hall B)
观众水平 (Level): 中级 (Intermediate)
必要预备知识
了解Hadoop基本原理,了解OLAP基础知识
您将学到什么
对以Kylin为代表的预处理数据类数据引擎的理解,启发观众从不同的角度思考如何面对不断升级的规模数据的挑战
描述
Apache Kylin v2.0即将发布!作为领先的大数据OLAP分析引擎,现在的Apache Kylin羽翼更丰:支持雪花模型、更加全面的SQL语法、初出茅庐的Spark Cubing、更好地支持实时流式数据接入等等。Apache Kylin正逐渐从一个Hadoop上的传统OLAP平台,演变为一个Hadoop上的实时数据仓库。本演讲将介绍Apache Kylin v2.0带来的最新特性,以及它们背后的技术架构和设计理念:
自v1.5起,Apache Kylin就支持通过micro-batch加载Kafka数据,实现了分钟级的准实时分析。到v2.0,Apache Kylin对Kafka数据源的支持更加稳定和友好,用户可以在同一个平台对流式数据和历史数据进行分析。
在过去,Apache Kylin只支持星型数据模型,给部分应用带来了局限。从v2.0开始,Apache Kylin将支持雪花模型,用户无需进行模型转换,就可以直接按现有数据模型在Kylin中建模,这使得Kylin可以更容易地应用在复杂案例当中。
预计算类分析平台意味着离线的数据预处理过程。对Apache Kylin而言,这个过程就是Cube的构建(Cubing),我们尝试使用Spark对现有的构建引擎进行大幅改进,并且收获了不错的初期结果。
Apache Kylin对SQL语法的支持也在不断改进,如支持时间函数、窗口函数、百分位等复杂函数。这些改进的需求起源于社区,也最终由社区的力量推动而实现。
区别于其他的SQL on Hadoop技术,Apache Kylin始终专注于尽量使用离线预计算替代在线计算。在这个数据规模日益激增的时代,如果希望以稳定的性能面对各类规模的数据挑战,Apache Kylin或许才是你的首选!
讲师介绍:
Dong Li (Kyligence)
Kyligence Inc技术合伙人兼高级软件架构师,Apache Kylin Committer & PMC Member,专注于大数据技术研发,KyBot技术负责人。毕业于上海交通大学计算机系;曾任eBay全球分析基础架构部高级工程师、微软云计算和企业产品部软件开发工程师;曾是微软商业产品Dynamics亚太团队核心成员,参与开发了新一代基于云端的ERP解决方案。
还有一天,欢迎大家踊跃报名!
点击阅读原文可登录会议网站,尽快报名以确定留位!
Apache Kylin 2.0:从Hadoop上的OLAP 引擎到实时数据仓库
讲师:Dong Li (Kyligence)
11:15–11:55 Saturday, 2017-07-15
数据工程和架构 (Data engineering and architecture)
地点: 紫金大厅B(Grand Hall B)
观众水平 (Level): 中级 (Intermediate)
必要预备知识
了解Hadoop基本原理,了解OLAP基础知识
您将学到什么
对以Kylin为代表的预处理数据类数据引擎的理解,启发观众从不同的角度思考如何面对不断升级的规模数据的挑战
描述
Apache Kylin v2.0即将发布!作为领先的大数据OLAP分析引擎,现在的Apache Kylin羽翼更丰:支持雪花模型、更加全面的SQL语法、初出茅庐的Spark Cubing、更好地支持实时流式数据接入等等。Apache Kylin正逐渐从一个Hadoop上的传统OLAP平台,演变为一个Hadoop上的实时数据仓库。本演讲将介绍Apache Kylin v2.0带来的最新特性,以及它们背后的技术架构和设计理念:
自v1.5起,Apache Kylin就支持通过micro-batch加载Kafka数据,实现了分钟级的准实时分析。到v2.0,Apache Kylin对Kafka数据源的支持更加稳定和友好,用户可以在同一个平台对流式数据和历史数据进行分析。
在过去,Apache Kylin只支持星型数据模型,给部分应用带来了局限。从v2.0开始,Apache Kylin将支持雪花模型,用户无需进行模型转换,就可以直接按现有数据模型在Kylin中建模,这使得Kylin可以更容易地应用在复杂案例当中。
预计算类分析平台意味着离线的数据预处理过程。对Apache Kylin而言,这个过程就是Cube的构建(Cubing),我们尝试使用Spark对现有的构建引擎进行大幅改进,并且收获了不错的初期结果。
Apache Kylin对SQL语法的支持也在不断改进,如支持时间函数、窗口函数、百分位等复杂函数。这些改进的需求起源于社区,也最终由社区的力量推动而实现。
区别于其他的SQL on Hadoop技术,Apache Kylin始终专注于尽量使用离线预计算替代在线计算。在这个数据规模日益激增的时代,如果希望以稳定的性能面对各类规模的数据挑战,Apache Kylin或许才是你的首选!
讲师介绍:
Dong Li (Kyligence)
Kyligence Inc技术合伙人兼高级软件架构师,Apache Kylin Committer & PMC Member,专注于大数据技术研发,KyBot技术负责人。毕业于上海交通大学计算机系;曾任eBay全球分析基础架构部高级工程师、微软云计算和企业产品部软件开发工程师;曾是微软商业产品Dynamics亚太团队核心成员,参与开发了新一代基于云端的ERP解决方案。
相关文章推荐
- Kylin系列-分布式大数据多维分析(OLAP)引擎Apache Kylin安装配置及使用示例
- 分布式大数据多维分析(OLAP)引擎Apache Kylin安装配置及使用示例
- Kylin正式发布:面向大数据的终极OLAP引擎方案
- Apache Calcite:Hadoop中新型大数据查询引擎
- 分布式大数据多维分析(OLAP)引擎Apache Kylin安装配置及使用示例
- 基于hadoop生态圈的数据仓库实践 —— OLAP与数据可视化(六)
- 【Apache Kylin 】 大数据下的OLAP解决方案(原理篇)
- <关于数据仓库>基于docker的Mysql与Hadoop/Hive之间的数据转移 (使用Apache Sqoop™)
- OLAP 分析引擎 Kylin 项目加入 Apache 基金会孵化
- 分布式大数据多维分析(OLAP)引擎Apache Kylin安装配置及使用示例
- Apache Kylin在美团数十亿数据OLAP场景下的实践
- 星型数据仓库olap工具kylin介绍
- 基于hadoop生态圈的数据仓库实践 —— OLAP与数据可视化(二)
- druid.io 海量实时OLAP数据仓库 (翻译+总结) (1)——分析框架如hive或者redshift(MPPDB)、ES等
- 星型数据仓库olap工具kylin介绍
- Kylin正式发布:面向大数据的终极OLAP引擎方案
- 分布式大数据多维数据分析(olap)引擎kylin
- 基于hadoop生态圈的数据仓库实践 —— OLAP与数据可视化(四)
- 【Apache Kylin 】大数据下的OLAP解决方案(作业构建)
- 在Apache Hadoop和Spark上加速大数据加密 [session]