您的位置:首页 > 运维架构 > Apache

Apache Kylin 2.0:从Hadoop上的OLAP 引擎到实时数据仓库 [session]

2017-06-08 15:57 295 查看
Strata Data Conference早期门票优惠本周五即将截止!
还有一天欢迎大家踊跃报名!
点击阅读原文可登录会议网站,尽快报名以确定留位!

Apache Kylin 2.0:从Hadoop上的OLAP 引擎到实时数据仓库
讲师:Dong Li (Kyligence)

11:15–11:55 Saturday, 2017-07-15

数据工程和架构 (Data engineering and architecture)

地点: 紫金大厅B(Grand Hall B)

观众水平 (Level): 中级 (Intermediate)
必要预备知识
了解Hadoop基本原理,了解OLAP基础知识
您将学到什么
对以Kylin为代表的预处理数据类数据引擎的理解,启发观众从不同的角度思考如何面对不断升级的规模数据的挑战
描述
Apache Kylin v2.0即将发布!作为领先的大数据OLAP分析引擎,现在的Apache Kylin羽翼更丰:支持雪花模型、更加全面的SQL语法、初出茅庐的Spark Cubing、更好地支持实时流式数据接入等等。Apache Kylin正逐渐从一个Hadoop上的传统OLAP平台,演变为一个Hadoop上的实时数据仓库。本演讲将介绍Apache Kylin v2.0带来的最新特性,以及它们背后的技术架构和设计理念:
自v1.5起,Apache Kylin就支持通过micro-batch加载Kafka数据,实现了分钟级的准实时分析。到v2.0,Apache Kylin对Kafka数据源的支持更加稳定和友好,用户可以在同一个平台对流式数据和历史数据进行分析。
在过去,Apache Kylin只支持星型数据模型,给部分应用带来了局限。从v2.0开始,Apache Kylin将支持雪花模型,用户无需进行模型转换,就可以直接按现有数据模型在Kylin中建模,这使得Kylin可以更容易地应用在复杂案例当中。
预计算类分析平台意味着离线的数据预处理过程。对Apache Kylin而言,这个过程就是Cube的构建(Cubing),我们尝试使用Spark对现有的构建引擎进行大幅改进,并且收获了不错的初期结果。
Apache Kylin对SQL语法的支持也在不断改进,如支持时间函数、窗口函数、百分位等复杂函数。这些改进的需求起源于社区,也最终由社区的力量推动而实现。
区别于其他的SQL on Hadoop技术,Apache Kylin始终专注于尽量使用离线预计算替代在线计算。在这个数据规模日益激增的时代,如果希望以稳定的性能面对各类规模的数据挑战,Apache Kylin或许才是你的首选!
讲师介绍:
Dong Li (Kyligence)



Kyligence Inc技术合伙人兼高级软件架构师,Apache Kylin Committer & PMC Member,专注于大数据技术研发,KyBot技术负责人。毕业于上海交通大学计算机系;曾任eBay全球分析基础架构部高级工程师、微软云计算和企业产品部软件开发工程师;曾是微软商业产品Dynamics亚太团队核心成员,参与开发了新一代基于云端的ERP解决方案。

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: