您的位置：首页 > 运维架构 > Apache

Apache Kylin 2.0：从Hadoop上的OLAP 引擎到实时数据仓库 [session]

2017-06-08 15:57 295 查看

Strata Data Conference早期门票优惠本周五即将截止！
还有一天，欢迎大家踊跃报名！
点击阅读原文可登录会议网站，尽快报名以确定留位！

Apache Kylin 2.0：从Hadoop上的OLAP 引擎到实时数据仓库
讲师：Dong Li (Kyligence)

11:15–11:55 Saturday, 2017-07-15

数据工程和架构 (Data engineering and architecture)

地点：紫金大厅B（Grand Hall B)

观众水平 (Level): 中级 (Intermediate)
必要预备知识
了解Hadoop基本原理，了解OLAP基础知识
您将学到什么
对以Kylin为代表的预处理数据类数据引擎的理解，启发观众从不同的角度思考如何面对不断升级的规模数据的挑战
描述
Apache Kylin v2.0即将发布！作为领先的大数据OLAP分析引擎，现在的Apache Kylin羽翼更丰：支持雪花模型、更加全面的SQL语法、初出茅庐的Spark Cubing、更好地支持实时流式数据接入等等。Apache Kylin正逐渐从一个Hadoop上的传统OLAP平台，演变为一个Hadoop上的实时数据仓库。本演讲将介绍Apache Kylin v2.0带来的最新特性，以及它们背后的技术架构和设计理念：
自v1.5起，Apache Kylin就支持通过micro-batch加载Kafka数据，实现了分钟级的准实时分析。到v2.0，Apache Kylin对Kafka数据源的支持更加稳定和友好，用户可以在同一个平台对流式数据和历史数据进行分析。
在过去，Apache Kylin只支持星型数据模型，给部分应用带来了局限。从v2.0开始，Apache Kylin将支持雪花模型，用户无需进行模型转换，就可以直接按现有数据模型在Kylin中建模，这使得Kylin可以更容易地应用在复杂案例当中。
预计算类分析平台意味着离线的数据预处理过程。对Apache Kylin而言，这个过程就是Cube的构建（Cubing），我们尝试使用Spark对现有的构建引擎进行大幅改进，并且收获了不错的初期结果。
Apache Kylin对SQL语法的支持也在不断改进，如支持时间函数、窗口函数、百分位等复杂函数。这些改进的需求起源于社区，也最终由社区的力量推动而实现。
区别于其他的SQL on Hadoop技术，Apache Kylin始终专注于尽量使用离线预计算替代在线计算。在这个数据规模日益激增的时代，如果希望以稳定的性能面对各类规模的数据挑战，Apache Kylin或许才是你的首选！
讲师介绍：
Dong Li (Kyligence)

Kyligence Inc技术合伙人兼高级软件架构师，Apache Kylin Committer & PMC Member，专注于大数据技术研发，KyBot技术负责人。毕业于上海交通大学计算机系；曾任eBay全球分析基础架构部高级工程师、微软云计算和企业产品部软件开发工程师；曾是微软商业产品Dynamics亚太团队核心成员，参与开发了新一代基于云端的ERP解决方案。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航