您的位置:首页 > 其它

机器学习实战之k-近邻算法(7)---算法总结

2014-12-02 09:41 411 查看
kNN算法总结

(1)kNN算法是分类算法里面最简单的。也很有效。但是它的缺点过于明显,以至于大家都不会用。就是时间和空间复杂度都太大了。

(2)kNN算法必须保存所有的数据集,如果数据很大,空间占用十分大。

(3)对每个数据集的每个数据特征都需要计算距离值,这个在实际使用中将是致命的,十分耗时。

(4)鉴于此,它的算法一般仅仅适用于机器学习入门和开阔思维,实际中数据集都很大,所以很少用。

另外,书中提到的kNN无法给出数据的内在含义,意思是单纯的距离计算,忽略了数据本身可以带有和结果标签的强烈的关系,而决策树是对数据集本身进行分析,提取数据特征和标签之间的最有可能的关系式子,称之为规则,达到机器学习的目的。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: