k-means如何选择合适的k?
2013-11-08 11:26
99 查看
一般来说是三种思路:
1. 根据经验值人工设定.
2. 先用canopy跑一遍, 估算出K.
3. 对不同的K,画出损失函数随K的变化曲线,选择曲线的拐点对应的K. 一般按K=1,2,4,8......选择
在第一次随机选择K个中心点的时候,如果K<10,需要多次随机选取K个中心点,选择损失函数最小的作为最终的初始中心。K>10的时候,随机选择一次就可以了。
实际工程中, 往往是先熟悉数据, 根据业务需求人工选定合适的K, 大家有什么好的意见没?
1. 根据经验值人工设定.
2. 先用canopy跑一遍, 估算出K.
3. 对不同的K,画出损失函数随K的变化曲线,选择曲线的拐点对应的K. 一般按K=1,2,4,8......选择
在第一次随机选择K个中心点的时候,如果K<10,需要多次随机选取K个中心点,选择损失函数最小的作为最终的初始中心。K>10的时候,随机选择一次就可以了。
实际工程中, 往往是先熟悉数据, 根据业务需求人工选定合适的K, 大家有什么好的意见没?
相关文章推荐
- 如何选择合适的MySQL存储引擎
- 如何选择合适的MySQL存储引擎
- 如何选择合适的MySQL存储引擎
- 12.app后端如何选择合适的数据库产品
- 如何选择合适的地图注记手段
- 如何为Hadoop集群选择合适的硬件
- 12.app后端如何选择合适的数据库产品
- 深度学习中如何选择一款合适的GPU卡的一些经验和建议分享
- 如何选择合适IPC方式
- Oracle数据库中如何选择合适的索引类型
- 如何选择合适的MySQL存储引擎
- 如何选择一个合适的深度学习网络
- 如何在日常交流中选择合适的投资人?
- 关于-如何为虚拟化环境选择合适的存储设备?
- 如何选择合适的MySQL存储引擎
- 使用LoadRunner录制脚本时如何选择合适的协议
- 浅谈国内用户如何选择合适的VPS主机
- 如何在不同的阶段选择合适的学习资料