您的位置:首页 > 大数据 > 人工智能

如何张开怀抱迎接AI时代——机器/深度学习小白入门篇

2018-08-12 22:30 471 查看

大家好,这是我个人第一篇CSDN博客,旨在记录机器学习/深度学习过程中的一些经验和方法,分享对人工智能时代的一些看法,以及希望可以与各位大神进行一些技术探讨。
首先说一下我个人对于AI的看法吧。人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。AI是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。其实说白了,就是人类希望计算机可以向人类一样工作,甚至超过人类,去解决一些问题,并且希望计算机可以拥有更高的容错机制,去避免一些人类因疲劳过度、情绪不佳等原因导致的错误。 目前AI已经应用于很多领域像之前说到的数据挖掘(分类和回归)、图像识别(简单的例如二维码扫描)、语音识别(语音机器人Siri等)、自然语言处理(字段识别、垃圾邮件分类等)以及现在很多工业领域在做的汽车无人驾驶等等。 但是AI依然有很多难题需要攻克,毕竟计算机无法拥有像人类一样复杂而又神奇的神经系统(毕竟10万年的进化而来,但已经给深度神经网络DNN带来了一些启发),计算机的模型学习和数据存储更多的是基于物理的,而人类的思考学习方式更多的需要通过生物学来解释。
那么AI是不是就难以发展了呢?其实不然,人类最大的优势就是可以不断学习、不断的进步,为什么近些年AI发展迅速?很大程度上依赖于计算机技术的发展以及各行各业各个领域的庞大的数据库,这些是计算机进行学习的主要载体和输入来源,看到这里有很多人可以了解了机器的学习需要依赖于大量的数据,其实是一个统计学的范畴,所以有句话叫做:给定的数据决定了该项机器/深度学习的上限,而训练的模型是为了无限逼近这个上限。
这篇博客是面向对机器学习、深度学习等感兴趣,或者想要在此领域入行的一部分群体(其实小编自己也是菜鸟,分享一些经验),希望对大家有所帮助。
首先,一定的数学基础是必须的,《高等数学》、《线性代数》、《概率论》甚至《偏微分方程》相关的理论知识都是需要的,如果学过又遗忘了的话,不妨重新拾起一遍。
其次,就是专业一点的理论知识了,建议大家可以先学习李航的《统计学习方法》,这是一本非常好的书,简单易懂,新手必备;喜欢看英文文献并且听说能力较佳的大神们可以学习Andrew Ng的课程(有视频、课件和习题),这里附上学习地址:http://open.163.com/special/opencourse/machinelearning.html,另外像国内周志华先生的《机器学习》(又名西瓜书)也是很容易上手学习的一本书;如果想要学的更深的话,可以进一步进行深度学习(CNN、RNN、DNN等),这里推荐一本个人看过的书籍《深度学习》(伊恩 古德菲尔德),另外有很多大神的博客可以参考,不得不说CSDN为广大求知者提供了很好的平台,这里的很多学习经验可以让小白们少走很多弯路。
接下来,就需要一门计算机语言去实现你的算法,这里我个人学习运用的是Python,另外像R等计算机语言都是可以的,目前基于Python语言的机器学习库和深度学习框架等都是比较全面的。
1、Python的安装(建议64位操作系统,基于Python的深度学习框架Tensorflow目前不支持32位的win系统,如果不做深度学习的话就无所谓啦)
可以到https://www.python.org/官网上进行Python安装包的下载和本地安装(本人安装的是Python3.5.3版本,注意需要配置环境变量),相关教程有很多博客指导,这里不再赘述;其次就是很多实用有效的机器学习需要用到的模块:Pandas(功能很强大)/sklearn(含有众多经典分类、回归模型,不用再自己敲代码,直接调用就可以了)/numpy/matplotlib等,分别是用于数据处理和后处理显示。 如有需要利用神经网络进行相关问题研究,可以下载安装比较主流的深度学习框架Tensorflow,这里附上教程地址http://www.tensorfly.cn/tfdoc/tutorials/mnist_tf.html
3、接下来就是实战啦,如果手上没有一些业务项目进行实践,推荐2个比较好的平台Kaggle和天池,都是开源社区,某些企业发布的项目还有奖金可以赢取(还在等什么,赶紧行动起来,成为码农界的百万富翁吧)
我个人是通过Kaggle进行机器/深度学习时间的,老规矩,附上官网:https://www.baidu.com/link?url=xlo6_bHZ58ikPtUApFEfJ08_QLZjy1QSxJaVANCQWWRcRD4Zy_VXBbKY6dywiHD4&wd=&eqid=d617b4780000afca000000025b7041c1 建议用Chorme浏览器打开,还要进行验证码提交,首次注册可能会遇到问题,搜索相关博客,下载一个谷歌小助手的插件,即可解决。
Kaggle的项目分为入门级、Inclass、企业项目(一般有奖金),都可以下载数据到本地进行模型训练,某些项目需要通过Kernels进行代码提交(出题方需要获得相关模型,尤其是企业项目),提交结果后会有一个Leaderboard排名,就可以看到自己的位置啦,不得不说Kaggle上牛人还是很多的,大家可以在这个过程中不断的进行学习和交流。
OK,今天是假期的最后一天,就写这么多啦,各位早点休息,希望我的分享能够帮助到大家,如果有任何疑问可随时留言交流,谢谢!
汪汪_AI_Boy

阅读更多
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: