开源大数据周刊-第74期
2017-12-08 14:44
288 查看
原文链接:点击打开链接
摘要: 资讯 大数据早报:海量大数据重度孵化器获A+轮融资 阿里自然语言处理技术获突破11月29日消息,海量大数据重度孵化器宣布公司已于2017年10月获得了广州众上集团的A+轮投资。 百度开源高性能 Python 分布式计算框架 Bigflow百度近日开源了一套计算框架 Bigflow , 致力于提供一套简单易用的接口来描述用户的计算任务,并使同一套代码可以运行在不同的执行引擎之上。
大数据早报:海量大数据重度孵化器获A+轮融资 阿里自然语言处理技术获突破
11月29日消息,海量大数据重度孵化器宣布公司已于2017年10月获得了广州众上集团的A+轮投资。
百度开源高性能Python分布式计算框架Bigflow
百度近日开源了一套计算框架 Bigflow , 致力于提供一套简单易用的接口来描述用户的计算任务,并使同一套代码可以运行在不同的执行引擎之上。
谷歌TPU团队离职创立的芯片公司Groq,把AI芯片的性能推向新高
AI芯片公司Groq由前Google员工创建,核心成员包括Google TPU的主要设计者之一Jonathan Ross。成立以来他们一直比较低调,刚刚才公开了官网。目前官网只有一张照片,但这张照片给出的信息:单芯片,400TOP/s的性能指标,8TOP/s/W的能效指标,可以说是简单粗暴。从这个团队成员和Google TPU的渊源来看,我们不妨拿Google TPU来作为参考分析一下。
深度 | 一文概览图卷积网络基本结构和最新进展
在当今世界中许多重要的数据集都以图或网络的形式出现:社交网络、知识图表、蛋白质交互网络、万维网等。然而直到最近,人们才开始关注将神经网络模型泛化以处理这种结构化数据集的可能性。
Hive0.13到Hive2.1跨版本升级全姿势
Hive是业界大数据平台使用最广泛的SQL引擎,提供了一层SQL抽象接口和一套元数据规范, 将SQL查询翻译为分布式的计算作业,支持MapReduce/Spark/Tez等多种计算引擎。 同时Hive定义的元数据标准已经成为了一种事实标准,业界流行的大数据SQL引擎均对Hive元数据进行了兼容和支持。
基于 Blink SQL 的阿里实时计算平台StreamCompute介绍
本文介绍了阿里巴巴当前 Blink SQL 丰富的功能,底层实现的原理,并且讲解流与表是如何相互转换的。目前阿里巴巴已经将大部分 Blink 和 Blink SQL 的改进贡献回 Flink 社区。本次分享会主要介绍了阿里巴巴对 Flink SQL 的各项贡献和改进,并向大家分享 Blink SQL 在阿里内部的大规模应用场景。
流计算框架 Flink 与 Storm 的性能对比
Apache Flink 和 Apache Storm 是当前业界广泛使用的两个分布式实时计算框架。其中 Apache Storm(以下简称“Storm”)在美团点评实时计算业务中已有较为成熟的运用,有管理平台、常用 API 和相应的文档,大量实时作业基于 Storm 构建。
四大分布式深度学习框架在GPU上的性能评测
近年来,深度学习(DL)技术在许多 AI 应用当中取得了巨大成功。在获得大量数据的情况下,深度神经网络(DNN)能够很好地学习特征表示。但是,深度神经网络和大规模数据有着很高的计算资源要求。
https://promotion.aliyun.com/ntms/act/ambassador/sharetouser.html?userCode=n7gh3gne&utm_source=n7gh3gne
我有几张阿里云幸运券分享给你,用券购买或者升级阿里云相应产品会有特惠惊喜哦!把想要买的产品的幸运券都领走吧!快下手,马上就要抢光了。
摘要: 资讯 大数据早报:海量大数据重度孵化器获A+轮融资 阿里自然语言处理技术获突破11月29日消息,海量大数据重度孵化器宣布公司已于2017年10月获得了广州众上集团的A+轮投资。 百度开源高性能 Python 分布式计算框架 Bigflow百度近日开源了一套计算框架 Bigflow , 致力于提供一套简单易用的接口来描述用户的计算任务,并使同一套代码可以运行在不同的执行引擎之上。
资讯
大数据早报:海量大数据重度孵化器获A+轮融资 阿里自然语言处理技术获突破11月29日消息,海量大数据重度孵化器宣布公司已于2017年10月获得了广州众上集团的A+轮投资。
百度开源高性能Python分布式计算框架Bigflow
百度近日开源了一套计算框架 Bigflow , 致力于提供一套简单易用的接口来描述用户的计算任务,并使同一套代码可以运行在不同的执行引擎之上。
谷歌TPU团队离职创立的芯片公司Groq,把AI芯片的性能推向新高
AI芯片公司Groq由前Google员工创建,核心成员包括Google TPU的主要设计者之一Jonathan Ross。成立以来他们一直比较低调,刚刚才公开了官网。目前官网只有一张照片,但这张照片给出的信息:单芯片,400TOP/s的性能指标,8TOP/s/W的能效指标,可以说是简单粗暴。从这个团队成员和Google TPU的渊源来看,我们不妨拿Google TPU来作为参考分析一下。
深度 | 一文概览图卷积网络基本结构和最新进展
在当今世界中许多重要的数据集都以图或网络的形式出现:社交网络、知识图表、蛋白质交互网络、万维网等。然而直到最近,人们才开始关注将神经网络模型泛化以处理这种结构化数据集的可能性。
技术
Hive0.13到Hive2.1跨版本升级全姿势Hive是业界大数据平台使用最广泛的SQL引擎,提供了一层SQL抽象接口和一套元数据规范, 将SQL查询翻译为分布式的计算作业,支持MapReduce/Spark/Tez等多种计算引擎。 同时Hive定义的元数据标准已经成为了一种事实标准,业界流行的大数据SQL引擎均对Hive元数据进行了兼容和支持。
基于 Blink SQL 的阿里实时计算平台StreamCompute介绍
本文介绍了阿里巴巴当前 Blink SQL 丰富的功能,底层实现的原理,并且讲解流与表是如何相互转换的。目前阿里巴巴已经将大部分 Blink 和 Blink SQL 的改进贡献回 Flink 社区。本次分享会主要介绍了阿里巴巴对 Flink SQL 的各项贡献和改进,并向大家分享 Blink SQL 在阿里内部的大规模应用场景。
流计算框架 Flink 与 Storm 的性能对比
Apache Flink 和 Apache Storm 是当前业界广泛使用的两个分布式实时计算框架。其中 Apache Storm(以下简称“Storm”)在美团点评实时计算业务中已有较为成熟的运用,有管理平台、常用 API 和相应的文档,大量实时作业基于 Storm 构建。
四大分布式深度学习框架在GPU上的性能评测
近年来,深度学习(DL)技术在许多 AI 应用当中取得了巨大成功。在获得大量数据的情况下,深度神经网络(DNN)能够很好地学习特征表示。但是,深度神经网络和大规模数据有着很高的计算资源要求。
https://promotion.aliyun.com/ntms/act/ambassador/sharetouser.html?userCode=n7gh3gne&utm_source=n7gh3gne
我有几张阿里云幸运券分享给你,用券购买或者升级阿里云相应产品会有特惠惊喜哦!把想要买的产品的幸运券都领走吧!快下手,马上就要抢光了。