您的位置:首页 > 大数据 > 人工智能

人工智能复习

2016-01-08 23:35 337 查看
L1 Introduction

1、有监督学习和无监督学习(supervised study and unsupervised study):区别在于自己是否知道正确答案,对于数据集来说也就是有没有标签(label)

比如对于KNN,训练数据的每一个属性值都已经知道,这个就是有监督的学习,而K-means算法事先是不知道每个点是属于哪一类的,所以是无监督的学习。

讲到这里再说两个概念的区别:分类和回归(来自知乎https://www.zhihu.com/question/21329754/answer/18004852 )分类是根据训练数据推出测试数据的类别,所以最后的输出只能是两个值。比如PLA和LR,它们都是分类的算法,而回归是根据训练数据输出最后的y(实数)是多少,比如KNN和NB是可以做回归的,不过它们也可以用来做分类。但是分类的算法,比如前面说的两种以及DT(决策树),一般就只能做分类。

至于无监督学习用到的K-means和Apriori等,就可以做复分类了,分出更多的类。

2、分类与回归

分类就是根据训练数据推测出测试数据属于哪一类。比如推测是什么花、这个物种是不是鸟。(相关数据的网址:http://archive.ics.uci.edu/ml/datasets.html )

而回归就是根据训练和测试数据的关系退出测试数据的取值。比如啤酒和尿布同时购买的概率、产量和销量的关系。

L2 数学基础

1、条件概率

1.1 乘法法则:



1.2 几个小题目



答案是1。可以把G理解成“明天出门还是在家”,L就是“明天下雨”,所以整个公式的计算结果就是如果明天下雨(注意是前提),明天出门、在家待的概率之和。所以结果是1。



这道题要从最后的结果入手:假设最后选的是水果j,那么前面的n-1次选的都不是水果j,所以概率就是P(1-j)^(n-1)*Pj。最后求个和就行了。

1.3 方差(Variance)



1.4 协方差(Covariance)



1.5 相关系数(Correlation)



相关系数反映的是一种相关关系,比如x和y之间的关系,如果是下图这样,那么它们的相关系数就是0



1.6 正态随机分布(Normal)



1.7 距离



习题:





首先我们要知道协方差矩阵是一个什么东西:



而cov(x, x)=var(x),所以如果算出了第一题的结果,第二题算相关系数直接用第一题的数据就行了。





L3 Logic(To be continue…)
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: