阿里云MaxCompute持续挑战极限,北京云栖大会现场完成基于公共云的BigBench评测!
2017-12-18 16:15
387 查看
2017年12月19 -20日,引发全球科技共振的云栖大会在国家会议中心举办2017年的压轴场—北京峰会。在本次大会上,阿里云主力计算平台MaxCompute将全球首次现场完成基于公共云的BigBench评测,并由阿里云总裁胡晓明在20日上午的主论坛宣布最终结果,令人期待。
什么是BigBench大数据测试基准?
BigBench是基于零售业场景构建的端到端大数据测试基准,支持主流分布式大数据处理引擎,模拟了整个线上与线下业务流程,有30个查询语句,涉及到描述性过程型查询、数据挖掘以及机器学习的算法。涵盖了结构化、半结构化和非结构化数据,相对sort单一的数据结构和计算方式,能够从客户实际场景角度更全面的评估大数据系统软硬件性能。
什么是MaxCompute?
作为全新一代人工智能计算引擎的MaxCompute(原ODPS),是一项提供快速、完全托管的PB级数据仓库解决方案的大数据计算服务,可以高效并经济的分析处理海量数据。
MaxCompute2.0是阿里巴巴内部和阿里云的大数据旗舰平台,阿里巴巴近99%的数据存储以及95%的计算能力都在这个平台上产生。在今年的双11当天,MaxCompute当日数据处理超过320PB,相当于全球最大图书馆-美国国会图书馆藏书存储的信息量的1200倍。同时数百万级的调度作业,持续冲击极限,以75%的增量全面超越2016年双11。
MaxCompute2.0在保持了大规模计算存储、强数据安全、高性能低成本的前提下,支持多源异构数据的离线/实时采集,支持SQL、MR、UDF(Java/Python)Graph、交互式、内存计算、机器学习等多种计算模式。为众安保险、华大基因、ofo小黄车等众多客户提供计算服务,为企业极大的提升了运行效率,降低了财务和人力成本。
MaxCompute为什么选择在北京云栖大会现场完成BigBench评测?
作为计算平台,性能和效率是最核心的指标。作为阿里云的主力计算平台,MaxCompute一直积极参加各类计算评测,通过评测来推动阿里云计算性能的不断提升。
2015年我们参加了GraySort 评测。该比赛旨在评测超大规模数据量排序的速度,阿里云计算平台最终以377秒完成了100TB的数据排序,打破了Apache Spark23.4分钟的原有记录。
2016年我们参加了被称为“云计算效率之争”的CloudSort,以0.82美金/TB的成绩获得Indy(专用目的排序)和Daytona(通用目的排序) 两个子项的世界冠军,打破了AWS在2014年保持的纪录4.51美金/TB。阿里云计算平台在“算的快”的前提下,进一步创造了性价比的新世界记录。
2017年MaxCompute希望能从更接近实际生产场景和客户场景的角度,来呈现阿里云计算平台的计算速度和性价比优势。进行BigBench评测是因为它是基于零售业场景构建的端到端大数据测试基准,支持主流分布式大数据处理引擎,模拟了整个线上与线下业务流程,有30个查询语句,涉及到描述性过程型查询、数据挖掘以及机器学习的算法。涵盖了结构化、半结构化和非结构化数据,相对sort单一的数据结构和计算方式,能够从客户实际场景角度更全面的评估大数据系统软硬件性能。在把TPC的benchmark适配到MaxCompute后,我们将数据规模提升至100TB来完成本次直播评测,
我们对评测结果和计算能力有着绝对的信心,希望在云栖大会北京峰会主论坛和展厅现场与各位开发者和大数据爱好者共同见证。
2017年12月19日-20日,国际会议中心南序厅(近国家体育场北路)“大数据计算服务MaxCompute”展台,不见不散。
什么是BigBench大数据测试基准?
BigBench是基于零售业场景构建的端到端大数据测试基准,支持主流分布式大数据处理引擎,模拟了整个线上与线下业务流程,有30个查询语句,涉及到描述性过程型查询、数据挖掘以及机器学习的算法。涵盖了结构化、半结构化和非结构化数据,相对sort单一的数据结构和计算方式,能够从客户实际场景角度更全面的评估大数据系统软硬件性能。
什么是MaxCompute?
作为全新一代人工智能计算引擎的MaxCompute(原ODPS),是一项提供快速、完全托管的PB级数据仓库解决方案的大数据计算服务,可以高效并经济的分析处理海量数据。
MaxCompute2.0是阿里巴巴内部和阿里云的大数据旗舰平台,阿里巴巴近99%的数据存储以及95%的计算能力都在这个平台上产生。在今年的双11当天,MaxCompute当日数据处理超过320PB,相当于全球最大图书馆-美国国会图书馆藏书存储的信息量的1200倍。同时数百万级的调度作业,持续冲击极限,以75%的增量全面超越2016年双11。
MaxCompute2.0在保持了大规模计算存储、强数据安全、高性能低成本的前提下,支持多源异构数据的离线/实时采集,支持SQL、MR、UDF(Java/Python)Graph、交互式、内存计算、机器学习等多种计算模式。为众安保险、华大基因、ofo小黄车等众多客户提供计算服务,为企业极大的提升了运行效率,降低了财务和人力成本。
MaxCompute为什么选择在北京云栖大会现场完成BigBench评测?
作为计算平台,性能和效率是最核心的指标。作为阿里云的主力计算平台,MaxCompute一直积极参加各类计算评测,通过评测来推动阿里云计算性能的不断提升。
2015年我们参加了GraySort 评测。该比赛旨在评测超大规模数据量排序的速度,阿里云计算平台最终以377秒完成了100TB的数据排序,打破了Apache Spark23.4分钟的原有记录。
2016年我们参加了被称为“云计算效率之争”的CloudSort,以0.82美金/TB的成绩获得Indy(专用目的排序)和Daytona(通用目的排序) 两个子项的世界冠军,打破了AWS在2014年保持的纪录4.51美金/TB。阿里云计算平台在“算的快”的前提下,进一步创造了性价比的新世界记录。
2017年MaxCompute希望能从更接近实际生产场景和客户场景的角度,来呈现阿里云计算平台的计算速度和性价比优势。进行BigBench评测是因为它是基于零售业场景构建的端到端大数据测试基准,支持主流分布式大数据处理引擎,模拟了整个线上与线下业务流程,有30个查询语句,涉及到描述性过程型查询、数据挖掘以及机器学习的算法。涵盖了结构化、半结构化和非结构化数据,相对sort单一的数据结构和计算方式,能够从客户实际场景角度更全面的评估大数据系统软硬件性能。在把TPC的benchmark适配到MaxCompute后,我们将数据规模提升至100TB来完成本次直播评测,
我们对评测结果和计算能力有着绝对的信心,希望在云栖大会北京峰会主论坛和展厅现场与各位开发者和大数据爱好者共同见证。
2017年12月19日-20日,国际会议中心南序厅(近国家体育场北路)“大数据计算服务MaxCompute”展台,不见不散。
相关文章推荐
- 阿里云MaxCompute持续挑战极限,北京云栖大会现场完成基于公共云的BigBench评测!
- 2月06日云栖精选夜读:高德地图基于阿里云MaxCompute的最佳实践
- 【物流大数据实践】基于阿里云Maxcompute实现物流跟踪
- 2月06日云栖精选夜读:高德地图基于阿里云MaxCompute的最佳实践
- 基于阿里云数加MaxCompute的企业大数据仓库架构建设思路
- 高德地图基于阿里云MaxCompute的最佳实践
- 比自建 Hadoop 还便宜!云栖大会揭秘阿里云数加 MaxCompute
- 【云栖大会】阿里云李津:持续释放技术红利,为1000万企业提供技术平台
- 基于阿里云数加MaxCompute的企业大数据仓库架构建设思路
- 阿里云数加大数据计算服务MaxCompute文章索引(持续更新201705)
- 高德地图基于阿里云MaxCompute的最佳实践
- 阿里云MaxCompute加速全球化布局 11月1日北京、马来西亚两地开服
- 视频服务降价34%,基础设施降价25%,阿里云北京云栖大会再次释放技术红利
- 基于阿里云数加MaxCompute的企业大数据仓库架构建设思路
- 阿里云数加大数据计算服务MaxCompute学习路线图 (持续更新中)
- 阿里云MaxCompute加速全球化布局 11月1日北京、马来西亚两地开服
- 【数据架构解读】基于阿里云数加StreamCompute和MaxCompute构建的访问日志统计分析
- 高德地图基于阿里云MaxCompute的最佳实践
- 基于阿里云数加MaxCompute的企业大数据仓库架构建设思路
- 2017年12月19-20日 阿里云 飞天/智能 云栖大会-北京峰会 会议笔记