读后感:微软首席数据科学家谢梁的AI故事
2017-10-20 09:27
597 查看
来源:http://blog.csdn.net/qq_40027052/article/details/78282091
CSDN:你的著作《Keras 快速上手:基于 Python 的深度学习实战》,选择从 Keras 入手简单、快速地设计模型,较少注底层代码,那我们是否可以这么推导:现在很多算法都封装好了,并且工业界应用的模型那么多,安心当调包侠就可以了?
谢梁:肯定不是这样的。诚然,现在的机器学习理论和算法越来越先进,很多以前需要数据科学家和分析师进行的工作都可以由算法自动完成,比如以前需要做很多人工的特征工程工作,现在新的算法将这方面的要求降低,但是如何选择合适的模型,如何对结果进行合理的解释仍然需要数据科学家有较好的理论训练和知识深度。
在工业界应用机器学习,包括三个部分:
前端对实际业务问题的理解和翻译;
中端对所选机器学习算法的实现;
末端对结果的解释和在业务上的运用。
现在有了较多可调用的机器学习包,只是让中段的一些工作简化,但同时对前端和末端提出了更多的要求,因为现在很多业务问题都非常复杂,如何将其合理地分解为可以进行建模的问题,非常考验实践工作者。同时,如何将分析结果植入到现有生产系统中,高效率高质量地运行也是不低的要求。
「调包侠」会是被人工智能代替的首批白领之一,所以当调包侠可没法安心。
CSDN:通过 Keras 快速体验深度学习之后,如果还想进一步提升,比如希望透彻理解底层原理和优化,或者这本书的经验用到移动端深度学习,你有什么建议?
谢梁:进一步提升需要跟上最新的进展,可以多读读这个领域顶级会议的文章。如果没有什么基础可以从以前的经典论文开始读,辅以 Ian Goodfellow 与 Yoshua Bengio 合写的《深度学习》这本书能较好地了解原理。之后可以关注当前顶级会议的文章,看看最新发展。
CSDN:有人评价说 Keras 不好调试,编译慢,那么 Keras + TensorFlow/CNTK 是否可以满足生产环境需求?
谢梁:相对于很多模型的训练时间,编译的耗时可以忽略不计。对于轻度的生产环境,Keras 本身就可以满足需求,比如用 neocortex.js 在浏览器中根据 Keras 模型实时打分。对于负载较大的生产环境或者对实时性要求非常高的生产环境,还是需要直接使用 TensorFlow 或者 CNTK 的底层 API。
CSDN:对于调参,有哪些经验可以分享?
谢梁:调参对于传统的机器学习方法通常是通过 Cross Validation 进行 greedy search,但是对于 hyperparameter 的范围大致根据经验有一个设定。对于深度学习的模型,还是根据数据量大小和特点选择合适的结构特征比较有效。
CSDN:你的著作《Keras 快速上手:基于 Python 的深度学习实战》,选择从 Keras 入手简单、快速地设计模型,较少注底层代码,那我们是否可以这么推导:现在很多算法都封装好了,并且工业界应用的模型那么多,安心当调包侠就可以了?
谢梁:肯定不是这样的。诚然,现在的机器学习理论和算法越来越先进,很多以前需要数据科学家和分析师进行的工作都可以由算法自动完成,比如以前需要做很多人工的特征工程工作,现在新的算法将这方面的要求降低,但是如何选择合适的模型,如何对结果进行合理的解释仍然需要数据科学家有较好的理论训练和知识深度。
在工业界应用机器学习,包括三个部分:
前端对实际业务问题的理解和翻译;
中端对所选机器学习算法的实现;
末端对结果的解释和在业务上的运用。
现在有了较多可调用的机器学习包,只是让中段的一些工作简化,但同时对前端和末端提出了更多的要求,因为现在很多业务问题都非常复杂,如何将其合理地分解为可以进行建模的问题,非常考验实践工作者。同时,如何将分析结果植入到现有生产系统中,高效率高质量地运行也是不低的要求。
「调包侠」会是被人工智能代替的首批白领之一,所以当调包侠可没法安心。
CSDN:通过 Keras 快速体验深度学习之后,如果还想进一步提升,比如希望透彻理解底层原理和优化,或者这本书的经验用到移动端深度学习,你有什么建议?
谢梁:进一步提升需要跟上最新的进展,可以多读读这个领域顶级会议的文章。如果没有什么基础可以从以前的经典论文开始读,辅以 Ian Goodfellow 与 Yoshua Bengio 合写的《深度学习》这本书能较好地了解原理。之后可以关注当前顶级会议的文章,看看最新发展。
CSDN:有人评价说 Keras 不好调试,编译慢,那么 Keras + TensorFlow/CNTK 是否可以满足生产环境需求?
谢梁:相对于很多模型的训练时间,编译的耗时可以忽略不计。对于轻度的生产环境,Keras 本身就可以满足需求,比如用 neocortex.js 在浏览器中根据 Keras 模型实时打分。对于负载较大的生产环境或者对实时性要求非常高的生产环境,还是需要直接使用 TensorFlow 或者 CNTK 的底层 API。
CSDN:对于调参,有哪些经验可以分享?
谢梁:调参对于传统的机器学习方法通常是通过 Cross Validation 进行 greedy search,但是对于 hyperparameter 的范围大致根据经验有一个设定。对于深度学习的模型,还是根据数据量大小和特点选择合适的结构特征比较有效。
相关文章推荐
- 从经济学博士到爬坑机器学习十年,微软首席数据科学家谢梁的AI故事
- 从经济学博士到爬坑机器学习十年,微软首席数据科学家谢梁的AI故事
- 从经济学博士到爬坑机器学习十年,微软首席数据科学家谢梁的AI故事
- 从经济学博士到爬坑机器学习十年,微软首席数据科学家谢梁的AI故事
- 专访 | 微软首席数据科学家谢梁:从经济学博士到爬坑机器学习,这十年我都经历了啥?
- Acorns首席数据科学家种骥科:AI在“移动优先”的互联网金融商业模式中的应用
- 微软AI首席科学家:AlphaGo激发全球人工智能进入新时代
- AI Frontiers | 微软首席 AI 科学家邓力演讲:口语对话系统的分类及三代演变
- 亚马逊前首席科学家:大数据价值体现在AI、BI、CI、DI
- 【重磅】微软AI首席科学家邓力:深度学习技术及趋势报告(75页PPT下载)
- 亚马逊前首席科学家:大数据价值体现在AI、BI、CI、DI
- 白宫正式命名DJ Patil担任首席数据科学家和制定数据策略的副首席技术官
- 不会做特征工程的 AI 研究员不是好数据科学家!上篇 - 连续数据的处理方法 本文作者:s5248 编辑:杨晓凡 2018-01-19 11:32 导语:即便现代机器学习模型已经很先进了,也别
- 大数据24小时:百度设立BI实验室和机器人与自动驾驶实验室,腾讯优图引入医疗AI科学家郑冶枫
- 微软为什么要公开AI系统测试数据集和度量指标?
- 【财富空间】将门CEO高欣欣、顺丰首席科学家刘志欣、图灵机器人联合创始人杨钊、中国人民大学向松祚等——AI应用落地:用产品说话
- 微软首席架构师Yaniv Pessach谈微软大数据COSMOS(中文意思是宇宙)
- 大数据24小时:猎豹移动CEO傅盛接替雷军任董事长一职,前微软美国研究院AI专家何晓冬加盟京东
- (转)颠覆主观对冲基金的量化工程师、AI专家和数据科学家
- 【工业大数据】 昆仑数据首席科学家田春华:人工智能降低了工业大数据分析的门槛