您的位置:首页 > 理论基础

机器学习基础概念

2017-03-03 16:12 239 查看
机器学习简单的说就是把无序的数据转化为有用的信息。机器学习横跨多门学科,包括计算机科学、工程技术、统计学等。

特征向量:数据属性的集合,通常用向量来表示

训练集:用来训练,也就是产生模型和算法的数据集

监督学习:知道预测什么,即知道目标变量的分类信息。分类和回归属于监督学习

无监督学习:数据没有类别信息,也不会给定目标值

半监督学习:有标记的训练集+无标记的训练集

监督学习中常用的算法

k-邻近算法:线性回归

朴素贝叶斯算法:局部加权线性回归

支持向量机:Ridge回归

决策树:Lasso最小回归系数估计

无监督学习常用算法

k-均值:最大期望算法

DBSCAN:Parzen窗设计

算法选择

(1)预测目标变量值——>Y/N——>有监督学习/无监督学习

(2)离散型(是/否、1/2/3)——>分类算法

(3)连续型数值——>回归算法

开发步骤

(1)收集数据

(2)准备输入数据

(3)分析输入数据

(4)训练算法

(5)测试算法

(6)使用算法

结语:“脱离业务和数据的算法讨论是毫无意义的”
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息