您的位置:首页 > 其它

机器学习中的必修数学(一)

2017-09-21 21:04 288 查看
机器学习的领域



基本的机器学习算法的分类



得分函数

如图,经过一系列的计算,最后得到的概率就叫得分函数



损失函数

得分函数与真实数据比较之后的误差叫做损失函数



机器学习中的算法简介

无监督学习(连续型):SVD、PCA、K-means

无监督学习(离散型):Apriori、FP-Growth、Hidden Markov Model

监督学习(连续型):Regression(Linear、Polynomial)、Decsion Trees、Random Forests

监督学习(离散型):Classification(KNN、Trees、Logistic Regression、Native-Bayes、SVM)



Scikit-learn Algorithm Cheat sheet



两边夹定理/夹逼定理



导数

导数是曲线的斜率,二阶导数是斜率变化快慢的反映



9. 方向导数



10. 梯度



11. 凸函数







12. 琴生不等式

如果是凸函数



13. 常见的概率分布







14. 概率



15. 常见函数的导数



16. 泰勒公式



17. 概率与统计的关注点



18. 概率统计与机器学习的关系



19. 方差



20. 协方差

协方差矩阵的特征分解-SVD

协方差是用来评价两个随机变量的线性关系

方差同时除以X的标准差和Y的标准差得出来的是相关系数



21. 期望



22. SVD的几何意义

原始数据,比如每一行都是一个文本,每列都是一个单词,实际上,我们对于每一个文本都可以用里面所有的单词出现的次数的一个向量作为表示,向量的每一行都对应的一个文本,变成一个矩阵,但是有一个问题,假设词语的个数有60个亿,那么有60亿的词语就有60亿的列,因为太大,所以放不下,因此需要使用方法截短,怎么挑出来?就是一个降维的问题

23. 矩阵乘法在计算中的优势

内积:向量和矩阵相乘

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息