您的位置:首页 > 其它

Weka 3.7.12源码学习、阅读、分析(1)

2015-11-16 00:00 211 查看
摘要: Weka是开源的基于Java实现的数据挖掘工具,对于数据挖掘爱好者来说,是一个应该掌握的工具之一。对Weka源码的分析,有助于提高对算法细节的理解,好处很多

直入主题:

从分类算法开始看起。

weka.classifier包

Classifier.class定义了分类算法的接口,weka所有的数值、分类属性的预测都应实现此接口,而一个分类器至少实现distributionForInstance() 或者 classifyInstance()中的一个。

public interface Classifier {

//作用:初始化分类的所有字段而不改变数据集,若分类器初始化不成功则抛出异常。

public abstract void buildClassifier(Instances data) throws Exception;

//作用:对给定的测试实例进行分类

public double classifyInstance(Instance instance) throws Exception;

//作用:预测一个给定实例的所属分类,如果是分类是数字型,则返回预测值

public double[] distributionForInstance(Instance instance) throws Exception;

//作用:返回分类器的一个负载能力,默认为最大负载,派生的分类器应该重写此方法,并禁用所有功能,之后根据派生分类器的需要开启特定功能

public Capabilities getCapabilities();
}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: