机器学习相关基本术语
2017-06-02 16:00
204 查看
机器学习相关基本术语
@(Machine Learning)学习/训练(Learning/Training):从数据中学得模型的过程。
学习过程就是找出或者逼近真相。
模型也称作学习器(learner)。
标记空间:label space
也称作输出空间。示例结果称作标记。
学习任务的分类
分类(classification)回归(regression)
预测的值是离散值时,学习任务叫作分类。
预测是追是连续值时,学习任务叫作回归。
分类的再次细分: 对于只有两个类别的称作二分类。分别称作正类和反类。
涉及到多个类别,称作多分类。
预测/测试
通过数据集学习到模型后,使用这个模型进行预测的过程称作测试(testing)。被预测的样本成为测试样本。如学习得到 f 后,对于测试例 x , 可得到预测标记是 y=f(x).
类比到数学上来,这也可以简单看做是朴素的函数思想。即:一个集合到另一个集合的映射,学习的模型就是一个函数的映射关系。只不过,这个映射关系是我们从数据中学习得到。多数情况下并非精确关系,但足够逼近事实就很好了。
聚类:clustering
将训练数据分为若干组,每个组称之为一个簇(cluster)。这种分类的依据我们事先并不知道,而是机器通过算法学习自动分类得到。即:学习过程中使用的样本通常不含有标记信息。监督学习与无监督学习
个人的理解是:监督学习是根据样本的标记信息,知道样本数据的输入对应的确定的输出,从中学习到一个模型,用于预测样本之外的数据。而无监督学习是样本不含标记。根据训练数据是否拥有标记信息,学习任务分为两类:监督学习 : supervised learning 和 无监督学习:unsupervised learning。
监督学习的代表是分类和回归。
无监督学习的代表是聚类。
值得强调的是:机器学习的目标是使得学到的模型能够很好的适用于新样本,而不仅仅是在样本上工作得很好。
泛化的理解
学得的模型适用于新样本的能力,被称之为泛化(generalization)。
这其实和我们自己学习知识并运用知识的过程很相似。比如数学的学习,我们很强调举一反三。我们做不到穷尽所有的题库,只能在有限的习题下学习抽象出解决问题的模型,再运用在新的问题上。
相关文章推荐
- 遗传算法与直接搜索工具箱学习笔记 六-----模式搜索相关术语解析
- 集群的基本概念及相关术语
- 机器学习自学入门相关推荐
- CentOS学习笔记--基本命令--目录的相关操作
- CI框架学习笔记(一) - 环境安装、基本术语和框架流程
- 测试驱动开发(tdd) 学习笔记(1)基本思想原则和术语
- 机器学习、数据挖掘、推荐系统相关书籍推荐
- 机器学习相关链接帖
- 学习笔记(一):计算机体系架构的术语和基本概念
- 严蔚敏数据结构学习(二)名词、术语、基本概念
- 开始IMS学习-相关名词和术语(持续更新)
- Socket 编程学习(1)—— TCP/IP体系结构、特点及相关术语
- 【CCNA学习实录】TCP/IP简介及相关术语
- (一)数据结构基本概念和术语学习
- 计算机视觉及机器学习相关文章及代码合集
- Webservice学习笔记一,基本术语
- 机器学习相关——文本分类综述
- 数据结构学习1基本概念和术语
- [数据挖掘与机器学习] 十张图解释机器学习的基本概念(转自IT面试论坛)
- 机器学习实战 (0) 机器学习相关简介