机器学习实战笔记(1)机器学习基础
2015-11-22 13:27
246 查看
机器学习基础
机器学习能让我们自数据集中受到启发,换句话说,我们会利用计算机来彰显数据背后的真实含义,这才是机器学习的真实含义。
1.1 何谓机器学习
简单来说,机器学习就是把无序的数据转换成有用的信息
1.2 开发机器学习应用程序的步骤
(1) 收集数据
(2) 准备输入数据
(3) 分析输入数据:这一步的主要作用是确保数据集中没有垃圾数据
(4) 训练算法:机器学习算法从这一步才真正开始学习。根据算法的不同,第4步 和第5步是机器学习算法的核心。我们将前两步得到的格式化数据输入算法,从中提取知识或信息。这里的到的知识需要存储为计算机可以处理的格式,方便后 续步骤使用。如果使用无监督学习算法,由于不存在目标变量值,故而也不需要训练算法,所有与算法相关的内容都集中在第5步。
(5) 测试算法:这一步将实际使用第4步机器学习得到的知识信息。为了评估算法,必须测试算法工作的效果,对于监督学习,必须已知评估算法的目标变量值;对于无监督学习,也必须用其他的评测手段来检验算法的成功率。无论哪种情形,如果不满意算法的输出结果,则可以回到第4步,改正并加以测试。问题常常会跟数据的收集和准备有关,这时你就必须跳回第1步从新开始。
(6) 使用算法:将机器学习算法转换为应用程序,执行实际任务,以检验上述步骤是否可以在实际环境中正常工作。如果碰到新的数据问题,同样需要重复执行上述步骤。
机器学习能让我们自数据集中受到启发,换句话说,我们会利用计算机来彰显数据背后的真实含义,这才是机器学习的真实含义。
1.1 何谓机器学习
简单来说,机器学习就是把无序的数据转换成有用的信息
1.2 开发机器学习应用程序的步骤
(1) 收集数据
(2) 准备输入数据
(3) 分析输入数据:这一步的主要作用是确保数据集中没有垃圾数据
(4) 训练算法:机器学习算法从这一步才真正开始学习。根据算法的不同,第4步 和第5步是机器学习算法的核心。我们将前两步得到的格式化数据输入算法,从中提取知识或信息。这里的到的知识需要存储为计算机可以处理的格式,方便后 续步骤使用。如果使用无监督学习算法,由于不存在目标变量值,故而也不需要训练算法,所有与算法相关的内容都集中在第5步。
(5) 测试算法:这一步将实际使用第4步机器学习得到的知识信息。为了评估算法,必须测试算法工作的效果,对于监督学习,必须已知评估算法的目标变量值;对于无监督学习,也必须用其他的评测手段来检验算法的成功率。无论哪种情形,如果不满意算法的输出结果,则可以回到第4步,改正并加以测试。问题常常会跟数据的收集和准备有关,这时你就必须跳回第1步从新开始。
(6) 使用算法:将机器学习算法转换为应用程序,执行实际任务,以检验上述步骤是否可以在实际环境中正常工作。如果碰到新的数据问题,同样需要重复执行上述步骤。
相关文章推荐
- 华为OJ中级题-查找两个字符串a,b中的最长公共子串
- linux 775和777权限有什么区别
- [LeetCode]Jump Game II
- gdb逆向调试
- ubuntu14.04完全卸载mysql
- mac 在 finder 当前 路径下 打开 terminal 的办法
- 架构的那些事2--安卓的奋进
- linux su和sudo命令的区别
- 数据类型输出
- 指令
- 【BZOJ】1532: [POI2005]Kos-Dicing
- web前端图表js选择-推荐highcharts
- [LeetCode]Longest Substring Without Repeating Characters
- 一些想法
- JS获取CSS样式(style/getComputedStyle/currentStyle)
- 【BZOJ】1524: [POI2006]Pal
- 进制之间的转换
- 优先级
- input标签placeholder属性IE8及以下版本的兼容性问题
- C++ Runtime Error :STL list "list iterator not incrementable"