您的位置：首页 > 大数据 > 人工智能

人工智能复习

2016-01-08 23:35 337 查看

L1 Introduction

1、有监督学习和无监督学习（supervised study and unsupervised study）：区别在于自己是否知道正确答案，对于数据集来说也就是有没有标签（label）

比如对于KNN，训练数据的每一个属性值都已经知道，这个就是有监督的学习，而K-means算法事先是不知道每个点是属于哪一类的，所以是无监督的学习。

讲到这里再说两个概念的区别：分类和回归（来自知乎https://www.zhihu.com/question/21329754/answer/18004852 ）分类是根据训练数据推出测试数据的类别，所以最后的输出只能是两个值。比如PLA和LR，它们都是分类的算法，而回归是根据训练数据输出最后的y（实数）是多少，比如KNN和NB是可以做回归的，不过它们也可以用来做分类。但是分类的算法，比如前面说的两种以及DT（决策树），一般就只能做分类。

至于无监督学习用到的K-means和Apriori等，就可以做复分类了，分出更多的类。

2、分类与回归

分类就是根据训练数据推测出测试数据属于哪一类。比如推测是什么花、这个物种是不是鸟。(相关数据的网址：http://archive.ics.uci.edu/ml/datasets.html )

而回归就是根据训练和测试数据的关系退出测试数据的取值。比如啤酒和尿布同时购买的概率、产量和销量的关系。

L2 数学基础

1、条件概率

1.1 乘法法则：