针对特征词选择法的验证实验“各种特征词选择算法对文本分类性能的影响”:纸上得来终觉浅,觉知此事要躬行 (实验数据下载)
2010-10-04 20:46
633 查看
(注:博文转载请注明作者和出处 作者:finallyliuyu 出处 博客园)
将实验数据公布出来,目的在于可以方便有相同爱好者的网友,直接下载中间数据快速重现实验。
资源空间提供方:download.csdn.net
统计词典以及关联表数据结构
每个数据包中共有四个文件:keywords.dat,testVSM.dat,trainingVSM.dat,evaluation.txt (.dat文件需要用ultraedit来查看)
全局DF法选取2000个关键词
IG法选取2000个关键词
卡方法选取2000个关键词
局部DF法选取4000个关键词
点互信息法选取2000个关键词
局部DF法选取1000个特征词
全局DF法选取1000个特征词
点互信息法选取1000个特征词
IG法选取1000个特征词
卡方法选取1000个特征词
将实验数据公布出来,目的在于可以方便有相同爱好者的网友,直接下载中间数据快速重现实验。
资源空间提供方:download.csdn.net
统计词典以及关联表数据结构
每个数据包中共有四个文件:keywords.dat,testVSM.dat,trainingVSM.dat,evaluation.txt (.dat文件需要用ultraedit来查看)
全局DF法选取2000个关键词
IG法选取2000个关键词
卡方法选取2000个关键词
局部DF法选取4000个关键词
点互信息法选取2000个关键词
局部DF法选取1000个特征词
全局DF法选取1000个特征词
点互信息法选取1000个特征词
IG法选取1000个特征词
卡方法选取1000个特征词
相关文章推荐
- 针对特征词选择法的验证实验“各种特征词选择算法对文本分类性能的影响”:纸上得来终觉浅,觉知此事要躬行
- 数据挖掘笔记-特征选择-算法实现-1
- 特征词选择算法对文本分类准确率的影响(二)
- 数据挖掘笔记-特征选择-算法实现-1
- 特征词选择算法对文本分类准确率的影响(三)
- ASP.NET文件下载各种方式比较:对性能的影响、对大文件的支持、对断点续传和多线程下载的支持
- 特征词选择算法对文本分类准确率的影响(四)
- [转]ASP.NET文件下载各种方式比较:对性能的影响、对大文件的支持、对断点续传和多线程下载的支持
- Feature Selection: A Data Perspective --阅读笔记2 传统数据的特征选择算法
- 特征词选择算法对文本分类准确率的影响(五)
- ASP.NET文件下载各种方式比较:对性能的影响、对大文件的支持、对断点续传和多线程下载的支持
- ASP.NET文件下载各种方式比较:对性能的影响、对大文件的支持、对断点续传和多线程下载的支持
- 借助weka实现的分类器进行针对文本分类问题的特征词选择实验(实验代码备份)
- 选择排序法 当数据量较小的时候,使用基本排序方案并不会显著影响程序性能。 选择排序是十分常用的基本排序方案之一。
- 文本分类入门(十)特征选择算法之开方检验
- 特征词选择算法对文本分类准确率的影响(前言)
- ASP.NET文件下载各种方式比较:对性能的影响、对大文件的支持、对断点续传和多线程下载的支持
- 特征选择mRMR算法代码实现及安装下载
- ASP.NET文件下载各种方式比较:对性能的影响、对大文件的支持、对断点续传和多线程下载的支持
- ASP.NET文件下载各种方式比较:对性能的影响、对大文件的支持、对断点续传和多线程下载的支持