TensorFlow团队发布带有新的移动GPU后端支持的TensorFlow Lite开发预览版
本周早些时候,TensorFlow团队发布了对TensorFlow Lite新增GPU后端支持的开发者预览版。计划于2019年晚些时候推出完整的开源版本。
该团队已经在他们的产品中使用谷歌的TensorFlow Lite GPU inference支持已有几个月了。例如,使用新的GPU后端加速前景 - 背景分割模型超过4倍,新的深度估计模型加速超过10倍。同样,使用GPU后端支持YouTube故事和游乐场贴纸,团队看到速度提高在各种手机的实时视频分割模型中,最多可达5-10倍。
他们发现,与不同深度神经网络模型的原始浮点CPU实现相比,新GPU后端的性能要快得多(快2-7倍)。该团队还指出,GPU速度对于涉及密集预测/分段或分类任务的更复杂的神经网络模型最为重要。对于小型号,加速可以更少,并且使用CPU将更有益,因为它将避免在存储器传输期间的延迟成本。
它是如何工作的?
一旦在Objective-C++中调用解释器:: ModifyGraphWithDelegate()或者使用Java中的Interpreter.Options调用Interpreter的构造函数,GPU委托首先被初始化。在此过程中,建立输入神经网络的规范表示,在该规范上应用一组变换规则。
在此之后,生成并编译计算着色器。 GPU后端目前在iOS上使用Android上的OpenGL ES 3.1 Compute Shaders和iOS上的Metal Compute Shaders。在创建计算着色器时采用各种特定于体系结构的优化。优化完成后,将编译着色器程序并准备好新的GPU推理引擎。根据每个输入的推断,如果需要,输入将移至GPU,执行着色器程序,并在必要时将输出移至CPU。
该团队打算在未来扩展操作范围,最终确定API并优化GPU后端的整体性能。
有关更多信息,请查看官方TensorFlow Lite GPU inference发行说明。
- [置顶] TensorFlow博客翻译——TensorFlow v0.9发布,带有增强版的移动支持
- tensorflow-gpu bug:The TensorFlow library wasn't compiled to use SSE instructions, but these are
- 多平台移动项目开发工具Elements发布v9.1,支持Visual Studio 2017
- win10配置TensorFlow GPU出现Failed to load the native TensorFlow runtime."
- 终于!谷歌移动端深度学习框架TensorFlow Lite正式发布
- 解决Tensorflow 使用时cpu编译不支持警告:that this TensorFlow binary was not compiled to use: AVX AVX2
- Failed to load the native TensorFlow runtime.Linux下解决方法Tensorflow GPU版本
- AI一分钟 | 上海大妈地铁站怒玩语音购票,支付宝喊话阿里云赶紧的;谷歌终于低头,TensorFlow Lite支持苹果AI框架
- 在 TensorFlow Lite 中支持 Core ML
- 在 Ubuntu 16.04 中安装支持 CPU 和 GPU 的 Google TensorFlow 神经网络软件
- 使用亚马逊AWS云服务器进行深度学习——免环境配置/GPU支持/Keras/TensorFlow/OpenCV
- Tensorflow lite for 移动端安卓开发(三)——移动端测试自己的模型
- Tensorflow lite for 移动端安卓开发(二)——完整详细过程训练自己的模型
- linux下theano/tensorflow安装cuda支持gpu
- 用Docker在Ubuntu下 设置一个完整的Python + TensorFlow + GPU support + jupyter notebook + Deep Learning 开发环境
- 8-17 安装tensorflow-gpu使用豆瓣源安装比较快 pip install tensorflow-gpu -i http://pypi.douban.com/simple
- Google 推出 TensorFlow Lite 开发者预览版,在 iOS 和 Android 端部署人工智能
- 一场谷歌与苹果的合作:TensorFlow Lite开始支持Core ML
- Netbeans 6.0发布,支持Ruby、移动开发和集成的剖析器
- windows系统下的keras(Theano/Tensorflow后端)CPU以及GPU加速环境搭建