您的位置:首页 > 其它

使用Weka进行数据挖掘(Weka教程九)模型序列化/持久化存储和加载

2016-03-15 14:42 429 查看
有很多时候,你在构建了一个模型并完成调优后,你很可能会想把这个模型存入到磁盘中,免得下次再重新训练。尤其是神经网络、SVM等模型训练时间非常长,重新训练非常浪费时间。那么怎么持久化模型呢?

其实既然模型也是一个JAVA对象,那我就按照JAVA的序列化和反序列化方法保存模型对象即可。

Java中的序列化和反序列化

①java.io.ObjectOutputStream

代表对象输出流,它的writeObject(Object obj)方法可对参数指定的obj对象进行序列化,把得到的字节序列写到一个目标输出流中。

  

②java.io.ObjectInputStream

代表对象输入流,它的readObject()方法从一个源输入流中读取字节序列,再把它们反序列化为一个对象,并将其返回。

需要注意的是,只有实现了Serializable和Externalizable接口的类的对象才能被序列化。Externalizable接口继承自 Serializable接口,实现Externalizable接口的类完全由自身来控制序列化的行为,而仅实现Serializable接口的类可采用默认的序列化方式 。

对象序列化包括如下步骤:

1) 创建一个对象输出流,它可以包装一个其他类型的目标输出流,如文件输出流;

2) 通过对象输出流的writeObject()方法写对象

对象反序列化的步骤如下:

1) 创建一个对象输入流,它可以包装一个其他类型的源输入流,如文件输入流;

2) 通过对象输入流的readObject()方法读取对象。

实现Weka模型的序列化

直接贴出代码,以J48为例

public static void persistModel(J48 model, String ModelPath) {
ObjectOutputStream oos = null;
try {
oos = new ObjectOutputStream(
new FileOutputStream(ModelPath));
oos.writeObject(model);
oos.flush();
oos.close();
} catch (IOException e) {
e.printStackTrace();
}
}


Weka模型的重新加载

重新加载模型只需要进行反序列化即可:

public static J48 reloadPersistModel(String ModelPath) {
ObjectInputStream ois = null;
try {
ois = new ObjectInputStream(
new FileInputStream(new File(ModelPath)));
J48 model = (J48) ois.readObject();
return model;
} catch (Exception e) {
e.printStackTrace();
}
return null;
}


需要注意的是,要将序列化后的对象向下转型才可以获取子类特有方法。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: