carrot 2 LingoClusteringAlgorithm , STCClusteringAlgorithm 和 BisectingKMeansClusteringAlgorithm算法比较
2013-11-11 11:45
417 查看
org.carrot2.clustering.lingo.LingoClusteringAlgorithm
适用于 结果聚类,文档数量 <1000,如果文档数量很大的话,花费时间较长
可以形成,比较长的形式比较好的标签
org.carrot2.clustering.stc.STCClusteringAlgorithm
形成的标签比较短
性能比较好,适用于 大数据量,比如整个索引的聚类
org.carrot2.clustering.kmeans.BisectingKMeansClusteringAlgorithm
适用于小数据量的聚类 <1000
对于一个聚类可以形成多个标签,来描述。
适用于 结果聚类,文档数量 <1000,如果文档数量很大的话,花费时间较长
可以形成,比较长的形式比较好的标签
org.carrot2.clustering.stc.STCClusteringAlgorithm
形成的标签比较短
性能比较好,适用于 大数据量,比如整个索引的聚类
org.carrot2.clustering.kmeans.BisectingKMeansClusteringAlgorithm
适用于小数据量的聚类 <1000
对于一个聚类可以形成多个标签,来描述。
相关文章推荐
- goagent 403错误解决办法
- how to keep impact-crusher in good condition
- django 模板报错
- Django开发指导
- 流行趋势:25款很酷的长阴影效果 LOGO 设计
- Django安装搭建开发环境
- django-dynamic-scraper(DDS)网页抓取环境安装搭建
- goagent代理出现40x问题
- data-intensive text processing with mapreduce-MapReduce Algorithm Design
- 来自Google产品管理和营销高级副总裁Jonathan Rosenberg的42条军规(转)
- 安卓google地图开发,只显示灰色方格,不能正常显示地图?求解。网上说key不对,我换了N多个key都不行。
- 海盗分金的博弈问题 pirates and gold 虚拟场景递推
- Google PageRank
- 抛弃Fastcgi,用uwsgi来部署你的Django程序吧
- [译]GotW #6a: Const-Correctness, Part 1
- 分类列表(wp_list_categories())函数用法详解
- pymongo 基本的操作
- Protobuf语言指南
- Django 学习笔记 看文档,一步步写(待续ing)
- django 模板标签 过滤器