您的位置：首页 > 其它

weka数据挖掘拾遗（三）----再谈如果何生成arff

2015-05-23 21:33 260 查看

前一阵子写过一个arff的随笔，但是写完后发现有些啰嗦。其实如果使用weka自带的api，生成arff文件将变成一件很简单的事儿。

首先，可以先把特征文件生成csv格式的。csv格式就是每列数据都用逗号分隔的一种格式。（还有不清楚的googling一下就知道了）

一、首先看下特征文件怎么保存成csv格式。

1、首行为特征名，以逗号分隔。

2、除首行外的行都为数据行，每列数据都是首行对应的值。（可以是字符串，数字）

例：

/**
* @function 保存Arff文件
* @param data arff格式的数据
* @param outputPath 数据保存路径
* @return
*/
public static boolean savaInstances(Instances data , String outputPath)
{
try{
BufferedWriter bw = new BufferedWriter(new OutputStreamWriter(
new FileOutputStream(outputPath), Charset.forName("utf-8")));

bw.write(data.toString());
bw.close();
}catch(Exception e){
e.printStackTrace();
return false;
}
return true;
}

View Code

三、总结

　　从上面的代码能看出，如果已经生成了csv格式的特征文件，那么生成arff文件也就是几行代码的事情。其实，如果生成了csv格式的特征文件，那么weka是直接可以读取的，之后使用 Instances data = csvLoader.getDataSet(); 这行代码其实就是把数据存到了Instances中，而Instances其实就是保存的arff格式的文件。如果没有其它必要，使用weka时，使用以csv格式的特征文件也是可以的，不必要非得转化成arff格式。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航