你可能不知道的一些机器学习事儿
2015-08-31 20:44
246 查看
你可能不知道的一些机器学习事儿
最近零零碎碎地看了很多机器学习方法的东西,增长了不少新知识。有很多小技巧虽然不会出现在教科书中,但它们真的很实用。
(1)随机森林模型不适合用稀疏特征。
(2)测试集必须使用与训练集相同的方法进行预处理。
(3)L1正则(特征选择)最小样本数目m与特征n呈log关系,m = O(log n) ;
L2正则(旋转不变)最小样本数目m与特征n呈线性关系,m = O(n) 。
(4)标准的PCA是一种线性转换技术。
(5)呈长尾分布的特征通常需要进行对数转换。
(6)线性SVM适合小样本。
(7)AUC适合作为类不平衡问题的衡量标准。
(8)在nested k-foldcross validation中,“外层循环”的目的是模型评估,“内层循环”的目的是模型选择。
最近零零碎碎地看了很多机器学习方法的东西,增长了不少新知识。有很多小技巧虽然不会出现在教科书中,但它们真的很实用。
(1)随机森林模型不适合用稀疏特征。
(2)测试集必须使用与训练集相同的方法进行预处理。
(3)L1正则(特征选择)最小样本数目m与特征n呈log关系,m = O(log n) ;
L2正则(旋转不变)最小样本数目m与特征n呈线性关系,m = O(n) 。
(4)标准的PCA是一种线性转换技术。
(5)呈长尾分布的特征通常需要进行对数转换。
(6)线性SVM适合小样本。
(7)AUC适合作为类不平衡问题的衡量标准。
(8)在nested k-foldcross validation中,“外层循环”的目的是模型评估,“内层循环”的目的是模型选择。
相关文章推荐
- 指针
- 1004. Counting Leaves (30)
- [leetcode-12]Integer to Roman(java)
- 进程间通信IPC
- 用缓冲流的方式实现文件的移动
- 十大编程算法助程序员走上高手之路
- c语言实现双向链表的基本操作
- 设计模式简介
- 内部类相关
- swerc2014 GREAT + SWERC = PORTO(dfs,注意姿势)
- 第一次博客,心情还有点小忐忑的说
- 红色警戒2修改器原理百科(六)
- PhpStorm注册码
- android 自定义View--漂亮的倒计时功能CountDownView
- Java心得25
- Android 开发最佳实践
- 8个发光二极管间隔200ms由上至下,再由下至上,再重复一遍,然后全部熄灭再次以300ms间隔全部闪烁5次,重复此过程
- Android 话筒、听筒、扬声器
- 重写与重载区别
- 8月31日实训总结