百度移动深度学习 Mobile-deep-learning(MDL)
2017-09-25 14:45
423 查看
Free and open source mobile deep learning framework, deploying by Baidu.
This research aims at simply deploying CNN on mobile devices, with low complexity and high speed. It supports calculation on iOS GPU, and is already adopted by Baidu APP.
Size: 340k+ (on arm v7)
Speed: 40ms (for iOS Metal GPU Mobilenet) or 30 ms (for Squeezenet)
百度研发的移动端深度学习框架,致力于让卷积神经网络极度简单的部署在手机端。目前正在手机百度内运行。支持iOS gpu计算。体积小,速度快。
体积 armv7 340k+
速度 iOS GPU mobilenet 可以达到 40ms、squeezenet 可以达到 30ms
项目地址:https://github.com/baidu/mobile-deep-learning
更多机器学习教程:http://www.tensorflownews.com
特征
一键部署,脚本参数就可以切换ios或者android
支持iOS gpu运行MobileNet、squeezenet模型
已经测试过可以稳定运行MobileNet、GoogLeNet v1、squeezenet模型
体积极小,无任何第三方依赖。纯手工打造。
提供量化脚本,对32位float转8位uint直接支持,模型体积量化后4M上下
与ARM相关算法团队线上线下多次沟通,针对ARM平台会持续优化
NEON使用涵盖了卷积、归一化、池化所有方面的操作
汇编优化,针对寄存器汇编操作具体优化
loop unrolling 循环展开,为提升性能减少不必要的CPU消耗,全部展开判断操作
将大量繁重的计算任务前置到overhead过程
This research aims at simply deploying CNN on mobile devices, with low complexity and high speed. It supports calculation on iOS GPU, and is already adopted by Baidu APP.
Size: 340k+ (on arm v7)
Speed: 40ms (for iOS Metal GPU Mobilenet) or 30 ms (for Squeezenet)
百度研发的移动端深度学习框架,致力于让卷积神经网络极度简单的部署在手机端。目前正在手机百度内运行。支持iOS gpu计算。体积小,速度快。
体积 armv7 340k+
速度 iOS GPU mobilenet 可以达到 40ms、squeezenet 可以达到 30ms
项目地址:https://github.com/baidu/mobile-deep-learning
更多机器学习教程:http://www.tensorflownews.com
特征
一键部署,脚本参数就可以切换ios或者android
支持iOS gpu运行MobileNet、squeezenet模型
已经测试过可以稳定运行MobileNet、GoogLeNet v1、squeezenet模型
体积极小,无任何第三方依赖。纯手工打造。
提供量化脚本,对32位float转8位uint直接支持,模型体积量化后4M上下
与ARM相关算法团队线上线下多次沟通,针对ARM平台会持续优化
NEON使用涵盖了卷积、归一化、池化所有方面的操作
汇编优化,针对寄存器汇编操作具体优化
loop unrolling 循环展开,为提升性能减少不必要的CPU消耗,全部展开判断操作
将大量繁重的计算任务前置到overhead过程
相关文章推荐
- 移动深度学习 Mobile-deep-learning(MDL)
- mobile-deep-learning(MDL)百度 移动端深度学习框架
- 百度开源移动端深度学习框架mobile-deep-learning
- 深度学习介绍(Introduction to Deep Learning)
- Attention and Memory in Deep Learning and NLP(深度学习和NLP中的注意和记忆机制) 阅读笔记
- 深度学习 Deep Learning UFLDL 最新Tutorial 学习笔记 3:Vectorization
- 深度增强学习Deep Reinforcement Learning (DQN方面)
- 中文译文:Minerva-一种可扩展的高效的深度学习训练平台(Minerva - A Scalable and Highly Efficient Training Platform for Deep Learning)
- Recommending music on Spotify with deep learning 采用深度学习算法为Spotify做基于内容的音乐推荐
- deep learning in NLP—深度学习在自然语言处理中的应用—入门学习序列
- [DeeplearningAI笔记]神经网络与深度学习人工智能行业大师访谈
- 最实用的深度学习教程 Practical Deep Learning For Coders (Kaggle 冠军 Jeremy Howard 亲授)
- 深度学习 Deep Learning UFLDL 最新Tutorial 学习笔记 4:Debugging: Gradient Checking
- 【深度学习】论文导读:ELU激活函数的提出(FAST AND ACCURATE DEEP NETWORK LEARNING BY EXPONENTIAL LINEAR UNITS (ELUS))
- DeepLearning.ai学习笔记(一)神经网络和深度学习--Week4深层神经网络
- 深度强化学习 Deep Reinforcement Learning 学习整理
- Joint Deep Learning For Pedestrian Detection(论文笔记-深度学习:行人检测)
- 林倞:Beyond Supervised Deep Learning--后深度学习时代的挑战
- 【文献阅读/翻译...】bayesian compression for deep learning深度学习中的贝叶斯压缩
- Spark MLlib Deep Learning Neural Net(深度学习-神经网络)1.1