您的位置:首页 > 编程语言 > Python开发

[python][numpy]简单K-近邻算法实现

2018-02-28 11:10 429 查看
代码来自  PeterHarrington. 机器学习实战[M]. 人民邮电出版社, 2013.  为了方便阅读做了简单的注释def classify0(inX, dataSet, labels, k):
dataSetSize = dataSet.shape[0] # 获取矩阵的维数(numpy中的函数)
diffMat = tile(inX, (dataSetSize, 1)) - dataSet # 先依据inX建立
# 一个与dataSet一样的矩阵,
# 然后计分别计算与dataSet每个点的距离
sqDiffMat = diffMat**2 # 计算diffMat的2次幂
sqDistances = sqDiffMat.sum(axis=1) # 默认axis是0,普通的相加
# axis是1, 矩阵的每一行相加
distances = sqDistances**0.5
sortedDistIndicies = distances.argsort() # 从大到小排序
classCount = {}
for i in range(k): # range()表示从0到k个数[0,1,....,k]
voteIlabel = labels[sortedDistIndicies[i]] # 拿到本值对应的label
classCount[voteIlabel] = classCount.get(voteIlabel, 0) + 1 # 去获取classCount中voteIlabel的值,没有则为0

# .iteritems()获取classCount的list迭代器
# 举例: a = {luning: 1,luningbaba,2}
# a.iteritems() 返回[('luning', 1),('luningbaba', 2)]
# sorted 排序,第一个参数是排序的主体,第二个是依据主体中的第几个数排序,第三个是是否逆序
# sorted 默认是从小到大排序
sortedClassCount = sorted(classCount.iteritems(), key=operator.itemgetter(1), reverse=True)
return sortedClassCount[0][0]参考资料:
1.sorted用法 https://www.cnblogs.com/sysu-blackbear/p/3283993.html
2.Python 字典(Dictionary) get()方法 http://www.runoob.com/python/att-dictionary-get.html
3.Python range() 函数用法. http://www.runoob.com/python/python-func-range.html
4.numpy中argsort函数用法. http://blog.csdn.net/iboxty/article/details/44975575
5.python中的sum函数.sum(axis=1) https://www.cnblogs.com/yyxayz/p/4033736.html
6.Python-Numpy的tile函数用法 https://www.cnblogs.com/zibu1234/p/4210521.html

7.python: numpy--函数 shape用法 http://blog.csdn.net/u010758410/article/details/71554224
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: