您的位置:首页 > 大数据 > 人工智能

读后感:微软首席数据科学家谢梁的AI故事

2017-10-20 09:27 597 查看
来源:http://blog.csdn.net/qq_40027052/article/details/78282091

CSDN:你的著作《Keras 快速上手:基于 Python 的深度学习实战》,选择从 Keras 入手简单、快速地设计模型,较少注底层代码,那我们是否可以这么推导:现在很多算法都封装好了,并且工业界应用的模型那么多,安心当调包侠就可以了?

谢梁:肯定不是这样的。诚然,现在的机器学习理论和算法越来越先进,很多以前需要数据科学家和分析师进行的工作都可以由算法自动完成,比如以前需要做很多人工的特征工程工作,现在新的算法将这方面的要求降低,但是如何选择合适的模型,如何对结果进行合理的解释仍然需要数据科学家有较好的理论训练和知识深度。 

在工业界应用机器学习,包括三个部分:
前端对实际业务问题的理解和翻译;
中端对所选机器学习算法的实现;
末端对结果的解释和在业务上的运用。

现在有了较多可调用的机器学习包,只是让中段的一些工作简化,但同时对前端和末端提出了更多的要求,因为现在很多业务问题都非常复杂,如何将其合理地分解为可以进行建模的问题,非常考验实践工作者。同时,如何将分析结果植入到现有生产系统中,高效率高质量地运行也是不低的要求。

「调包侠」会是被人工智能代替的首批白领之一,所以当调包侠可没法安心。

CSDN:通过 Keras 快速体验深度学习之后,如果还想进一步提升,比如希望透彻理解底层原理和优化,或者这本书的经验用到移动端深度学习,你有什么建议?

谢梁:进一步提升需要跟上最新的进展,可以多读读这个领域顶级会议的文章。如果没有什么基础可以从以前的经典论文开始读,辅以 Ian Goodfellow 与 Yoshua Bengio 合写的《深度学习》这本书能较好地了解原理。之后可以关注当前顶级会议的文章,看看最新发展。

CSDN:有人评价说 Keras 不好调试,编译慢,那么 Keras + TensorFlow/CNTK 是否可以满足生产环境需求?

谢梁:相对于很多模型的训练时间,编译的耗时可以忽略不计。对于轻度的生产环境,Keras 本身就可以满足需求,比如用 neocortex.js 在浏览器中根据 Keras 模型实时打分。对于负载较大的生产环境或者对实时性要求非常高的生产环境,还是需要直接使用 TensorFlow 或者 CNTK 的底层 API。

CSDN:对于调参,有哪些经验可以分享?

谢梁:调参对于传统的机器学习方法通常是通过 Cross Validation 进行 greedy search,但是对于 hyperparameter 的范围大致根据经验有一个设定。对于深度学习的模型,还是根据数据量大小和特点选择合适的结构特征比较有效。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  python 深度学习
相关文章推荐