weka数据挖掘拾遗(三)----再谈如果何生成arff
2015-05-23 21:33
260 查看
前一阵子写过一个arff的随笔,但是写完后发现有些啰嗦。其实如果使用weka自带的api,生成arff文件将变成一件很简单的事儿。
首先,可以先把特征文件生成csv格式的。csv格式就是每列数据都用逗号分隔的一种格式。(还有不清楚的googling一下就知道了)
一、首先看下特征文件怎么保存成csv格式。
1、首行为特征名,以逗号分隔。
2、除首行外的行都为数据行,每列数据都是首行对应的值。(可以是字符串,数字)
例:
View Code
三、总结
从上面的代码能看出,如果已经生成了csv格式的特征文件,那么生成arff文件也就是几行代码的事情。其实,如果生成了csv格式的特征文件,那么weka是直接可以读取的,之后使用 Instances data = csvLoader.getDataSet(); 这行代码其实就是把数据存到了Instances中,而Instances其实就是保存的arff格式的文件。如果没有其它必要,使用weka时,使用以csv格式的特征文件也是可以的,不必要非得转化成arff格式。
首先,可以先把特征文件生成csv格式的。csv格式就是每列数据都用逗号分隔的一种格式。(还有不清楚的googling一下就知道了)
一、首先看下特征文件怎么保存成csv格式。
1、首行为特征名,以逗号分隔。
2、除首行外的行都为数据行,每列数据都是首行对应的值。(可以是字符串,数字)
例:
/** * @function 保存Arff文件 * @param data arff格式的数据 * @param outputPath 数据保存路径 * @return */ public static boolean savaInstances(Instances data , String outputPath) { try{ BufferedWriter bw = new BufferedWriter(new OutputStreamWriter( new FileOutputStream(outputPath), Charset.forName("utf-8"))); bw.write(data.toString()); bw.close(); }catch(Exception e){ e.printStackTrace(); return false; } return true; }
View Code
三、总结
从上面的代码能看出,如果已经生成了csv格式的特征文件,那么生成arff文件也就是几行代码的事情。其实,如果生成了csv格式的特征文件,那么weka是直接可以读取的,之后使用 Instances data = csvLoader.getDataSet(); 这行代码其实就是把数据存到了Instances中,而Instances其实就是保存的arff格式的文件。如果没有其它必要,使用weka时,使用以csv格式的特征文件也是可以的,不必要非得转化成arff格式。
相关文章推荐
- weka数据挖掘拾遗(一)---- 生成Arff格式文件
- weka: 生成并保存ARFF格式数据
- 数据挖掘工具Weka之数据格式ARFF及CSV文件格式转换
- weka数据挖掘拾遗(二)---- 特征选择(IG、chi-square)
- 使用Weka进行数据挖掘(Weka教程二)Weka数据之ARFF与多文件格式转换
- 输入数据与ARFF文件--数据挖掘学习和weka使用(二)
- Weka中数据挖掘与机器学习系列之数据格式ARFF和CSV文件格式之间的转换(五)
- OneR算法和weka中OneR使用--数据挖掘学习和weka使用(四)
- 数据挖掘-基于机器学习的SNS隐私策略推荐向导分类器的C++及WEKA实现与评估
- 如果表结构发生改变,怎样避免重新生成表(保留原有数据)
- 推荐数据挖掘入门教材《数据挖掘与机器学习 WEKA应用技术与实践》
- Weka数据挖掘平台
- 数据挖掘工具weka中的算法列表
- Weka数据挖掘——分类
- Weka数据挖掘——聚类
- 数据挖掘(4):使用weka做关联规则挖掘
- 数据挖掘工具R软件与Weka的比较分析
- 用 WEKA 进行数据挖掘,第 3 部分: 最近邻和服务器端库
- 使用weka进行数据挖掘
- 用 WEKA 进行数据挖掘,第 1 部分: 简介和回归