java代码实现将无表头.txt文本文件转化为weka能识别.arff文件
2016-10-20 13:05
495 查看
首先,我们要有一个.txt文件,每一行中的元素个数是相同的(因为每一行中的每一个元素就代表了一种类型的属性值),文尾已奉上,读者自行下载。有的就不用下载了,
然后,,,
代码如下,具体的就不细讲了
import java.io.*;
import java.util.ArrayList;
/**
* Created by Administrator on 2016/10/20.
*/
public class dataMinner {
public static void main(String[] args) throws IOException {
FileReader reader = new FileReader("E:\\50words_TRAIN.txt");
BufferedReader br = new BufferedReader(reader);
StringBuffer sb = new StringBuffer("");
String str=null;
str=br.readLine();
String str2=str;
String[] attributes = str.split(",");
while((str=br.readLine())!=null){
sb.append(str+"\r\n");
}
br.close();
reader.close();
FileWriter writer = new FileWriter("E:\\50words_TRAIN.arff");
BufferedWriter bw = new BufferedWriter(writer);
bw.write("@relation"+" "+"test"+"\r\n");
for(int i = 0;i<attributes.length;i++){
bw.write("@attribute"+" "+"attribute"+i+" "+"numeric"+"\r\n");
}
bw.write("@data"+"\r\n");
bw.write(str2+"\r\n");
bw.write(sb.toString());
bw.close();
writer.close();
}
}
在此需注意的是java中换行符的表示是 \r\n ,而不是 \n ,因为windows不能识别 \n
然后,,,
代码如下,具体的就不细讲了
import java.io.*;
import java.util.ArrayList;
/**
* Created by Administrator on 2016/10/20.
*/
public class dataMinner {
public static void main(String[] args) throws IOException {
FileReader reader = new FileReader("E:\\50words_TRAIN.txt");
BufferedReader br = new BufferedReader(reader);
StringBuffer sb = new StringBuffer("");
String str=null;
str=br.readLine();
String str2=str;
String[] attributes = str.split(",");
while((str=br.readLine())!=null){
sb.append(str+"\r\n");
}
br.close();
reader.close();
FileWriter writer = new FileWriter("E:\\50words_TRAIN.arff");
BufferedWriter bw = new BufferedWriter(writer);
bw.write("@relation"+" "+"test"+"\r\n");
for(int i = 0;i<attributes.length;i++){
bw.write("@attribute"+" "+"attribute"+i+" "+"numeric"+"\r\n");
}
bw.write("@data"+"\r\n");
bw.write(str2+"\r\n");
bw.write(sb.toString());
bw.close();
writer.close();
}
}
在此需注意的是java中换行符的表示是 \r\n ,而不是 \n ,因为windows不能识别 \n
相关文章推荐
- java代码实现将时间序列数据集(UCR)转化为weka能识别的.arff文件
- 空间复杂度,实现从excel导出到txt文件中的java代码自动构建,逻辑条件不同实现则不同
- 用java实现从txt文本文件批量导入数据至数据库
- Spark1.6.2 java实现读取txt文件插入MySql数据库代码
- JAVA实现下载浏览器可以识别的TXT等文件。
- 在Java中使用weka:将实例转化为ARFF文件
- java图片开源框架tesseract调用OCR实现图片文件识别代码下载
- java 实现txt文件读取,写入操作实例代码。
- 实现文件下载的java代码
- 用java实现print screen,读取位图文件,将位图文件转化位jpeg格式并保存成文件输出!
- 自己动手实现简易代码生成器、采用文本模板文件生成服务层、服务层接口代码的做法参考
- JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例
- PHP通过header实现文本文件下载的代码
- JAVA SCRIPT 实现读写txt文件
- 自己动手实现简易代码生成器、采用文本模板文件生成服务层、服务层接口代码的做法参考
- 一个将数据文件转换成excel文件打印的java实现方法的代码片断(Struts+poi)
- java实现文件过滤的示例代码
- 利用JAVA/JSF/JSP实现读取并截取.txt文件http://zhidao.baidu.com/question/42189115.html
- PHP通过header实现文本文件下载的代码
- Java实现Socket发送和接收文件的代码