Python机器学习应用--KNN
2017-06-03 22:31
225 查看
KNN近邻分类器
一般步骤
1.计算待分类数据点,与已有数据集中的所有数据点的距离2.取距离最小的前k个点,根据“少数服从多数”,将数据点划分为出现次数最多的那个类别
sklearn中的KNN
使用sklearn.neighbors.KNeighborsClassifier创建KNN分类器,主要参数:
n_neighbors:指定分类器中K的大小(默认值为5)
weights:设置K个点对分类结果影响的权重(默认值为平均权重“uniform”,可以选择“distance”,代表越近的点权重越大,或者传入自己编写的以距离为参数的权重计算函数
algorithm:设置用户计算临近点的方法;当数据量很大时,计算当前点与所有点的距离再选出最近的K各点,计算费时
ball_tree、kd_tree、brute选项,分别代表寻找邻居的优化算法,默认为auto,根据训练数据自动选择
其他参数:
注意参数P:
整数,可选(默认为2)
1 曼哈顿距离
2 欧式距离
2.来个小例子
来自KNeighborsClassifier文档
关于K的取值:
较大–较大领域中的数据实例进行预测,可以减小估计误差,但距离较远的样本也会对预测起作用,导致预测错误
较小–如果领域恰好是噪声点,会导致过拟合
一般,倾向于选择较小的K值,使用交叉验证法选取最优K值
相关文章推荐
- Python机器学习应用 | KNN实现手写识别
- 基于Python的机器学习实战:KNN
- 机器学习python之KNN
- Python机器学习应用 | 降维——PCA方法及其应用
- 机器学习分类之结合实际应用介绍KNN算法原理以及利用sklearn进行分类预测
- Python机器学习应用 | 基于聚类的“图像分割”
- 机器学习实战python版归一化数值和测试kNN算法以及构建完整可用系统
- Python机器学习应用 | 多项式回归
- Python机器学习应用 | 降维——NMF方法及实例
- Python机器学习应用 | 无监督学习
- 机器学习实战_初识kNN算法_理解其python代码
- Python 学习笔记(Machine Learning In Action)K-近邻算法(KNN)机器学习实战
- Python机器学习应用 | 人体运动状态预测
- 机器学习实战——python实现knn算法
- 机器学习实战:KNN 代码注释(python)
- 机器学习与数据挖掘-K最近邻(KNN)算法的实现(java和python版)
- 机器学习实战 第二章KNN(1)python代码及注释
- Python机器学习应用 | 监督学习
- Python机器学习应用 | 基本分类模型
- Python机器学习应用 | 强化学习