机器学习中的分类、回归、标注
2017-12-28 21:54
190 查看
在数据挖掘、人工智能等领域中存在两个:分类和回归。单说分类很容易理解,但想到回归就容易分不清晰,那么这两者到底有什么区别和联系呢?下面简单介绍下我的理解。
其实回归问题和分类问题的本质一样,都是针对一个输入做出一个输出预测,其区别在于输出变量的类型。
分类问题是指,给定一个新的模式,根据训练集推断它所对应的类别(如:+1,-1),是一种定性输出,也叫离散变量预测;
许多的机器学习方法可以用来解决分类问题,包括kk近邻法、感知机、朴素贝叶斯法、决策树、逻辑斯谛回归模型、SVM、adaBoost、贝叶斯网络、神经网络等
回归问题是指,给定一个新的模式,根据训练集推断它所对应的输出值(实数)是多少,是一种定量输出,也叫连续变量预测。
举个例子:预测明天的气温是多少度,这是一个回归任务;预测明天是阴、晴还是雨,就是一个分类任务
标注问题也是一个监督学习问题。可以认为标记问题是分类问题的一个推广。
标注问题的输入是一个观测序列,输出的是一个标记序列或状态序列。也就是说,分类问题的输出是一个值,而标注问题输出是一个向量,向量的每个值属于一种标记类型。
标注常用的机器学习方法有:隐性马尔可夫模型、条件随机场。
自然语言处理中的词性标注(part of speech tagging)就是一个典型的标注问题:给定一个由单词组成的句子,对这个句子中的每一个单词进行词性标注,即对一个单词序列预测其对应的词性标记序列。
其实回归问题和分类问题的本质一样,都是针对一个输入做出一个输出预测,其区别在于输出变量的类型。
分类问题是指,给定一个新的模式,根据训练集推断它所对应的类别(如:+1,-1),是一种定性输出,也叫离散变量预测;
许多的机器学习方法可以用来解决分类问题,包括kk近邻法、感知机、朴素贝叶斯法、决策树、逻辑斯谛回归模型、SVM、adaBoost、贝叶斯网络、神经网络等
回归问题是指,给定一个新的模式,根据训练集推断它所对应的输出值(实数)是多少,是一种定量输出,也叫连续变量预测。
举个例子:预测明天的气温是多少度,这是一个回归任务;预测明天是阴、晴还是雨,就是一个分类任务
标注问题也是一个监督学习问题。可以认为标记问题是分类问题的一个推广。
标注问题的输入是一个观测序列,输出的是一个标记序列或状态序列。也就是说,分类问题的输出是一个值,而标注问题输出是一个向量,向量的每个值属于一种标记类型。
标注常用的机器学习方法有:隐性马尔可夫模型、条件随机场。
自然语言处理中的词性标注(part of speech tagging)就是一个典型的标注问题:给定一个由单词组成的句子,对这个句子中的每一个单词进行词性标注,即对一个单词序列预测其对应的词性标记序列。
相关文章推荐
- 【机器学习实战三:Logistic回归之点的二分类和预测病马的死亡率】
- 用Python开始机器学习(7:逻辑回归分类) --好!!
- [机器学习]逻辑回归,Logistic regression |分类,Classification
- 机器学习经典算法详解及Python实现--CART分类决策树、回归树和模型树
- 机器学习技法-决策树和CART分类回归树构建算法
- 机器学习:决策树cart算法在分类与回归的应用(下)
- 机器学习笔记04:逻辑回归(Logistic regression)、分类(Classification)
- 机器学习---分类、回归、聚类、降维的区别
- 机器学习与算法(13)--分类和回归树(CART)
- 【机器学习】回归分析、过拟合、分类
- 【机器学习笔记之三】CART 分类与回归树
- 斯坦福机器学习-第三周(分类,逻辑回归,过度拟合及解决方法)
- 机器学习(2)分类之逻辑回归
- 机器学习笔记十二:分类与回归树CART
- 用对数几率回归实现周志华《机器学习》习题3.3西瓜分类,python编程
- 【Todo】【转载】Spark学习 & 机器学习(实战部分)-监督学习、分类与回归
- 统计学习:泛化能力、生成模型、判别模型、分类、标注和回归问题
- 机器学习基础 维基翻译 保序回归 随机森林 Pipeline处理 及简单的sklearn例子 分类:机器学习Sklearn
- 机器学习决策树:sklearn分类和回归
- Hulu机器学习问题与解答系列 | 二十一:分类、排序、回归模型的评估