Weka 3.7.12源码学习、阅读、分析(1)
2015-11-16 00:00
211 查看
摘要: Weka是开源的基于Java实现的数据挖掘工具,对于数据挖掘爱好者来说,是一个应该掌握的工具之一。对Weka源码的分析,有助于提高对算法细节的理解,好处很多
直入主题:
从分类算法开始看起。
weka.classifier包
Classifier.class定义了分类算法的接口,weka所有的数值、分类属性的预测都应实现此接口,而一个分类器至少实现distributionForInstance() 或者 classifyInstance()中的一个。
public interface Classifier {
//作用:初始化分类的所有字段而不改变数据集,若分类器初始化不成功则抛出异常。
public abstract void buildClassifier(Instances data) throws Exception;
//作用:对给定的测试实例进行分类
public double classifyInstance(Instance instance) throws Exception;
//作用:预测一个给定实例的所属分类,如果是分类是数字型,则返回预测值
public double[] distributionForInstance(Instance instance) throws Exception;
//作用:返回分类器的一个负载能力,默认为最大负载,派生的分类器应该重写此方法,并禁用所有功能,之后根据派生分类器的需要开启特定功能
public Capabilities getCapabilities();
}
直入主题:
从分类算法开始看起。
weka.classifier包
Classifier.class定义了分类算法的接口,weka所有的数值、分类属性的预测都应实现此接口,而一个分类器至少实现distributionForInstance() 或者 classifyInstance()中的一个。
public interface Classifier {
//作用:初始化分类的所有字段而不改变数据集,若分类器初始化不成功则抛出异常。
public abstract void buildClassifier(Instances data) throws Exception;
//作用:对给定的测试实例进行分类
public double classifyInstance(Instance instance) throws Exception;
//作用:预测一个给定实例的所属分类,如果是分类是数字型,则返回预测值
public double[] distributionForInstance(Instance instance) throws Exception;
//作用:返回分类器的一个负载能力,默认为最大负载,派生的分类器应该重写此方法,并禁用所有功能,之后根据派生分类器的需要开启特定功能
public Capabilities getCapabilities();
}
相关文章推荐
- TurboMail反垃圾邮件系统提醒您辨别钓鱼邮件
- manerger层学习___查询
- manager学习_Update
- manager查询_分页
- hibernate查询_函数
- MySql error while loading shared libraries: libai
- Python语言精要
- 如何运用好MindMapper局部中心功能
- 在报表开发平台中集成第三方图表库
- 发送超长短信的协议格式
- 五分钟理解一致性哈希算法(consistent hashing)
- HTTP Cookie学习
- HOTPOWER.【专注游戏界面外包】/接游戏界面外包/logo外包/icon
- ZBrush®中Alt键和Shift键
- 蜂窝教育iOS培训:如何选择教学水平高机构
- C语言获取网页源代码
- MySQL磁盘复制技术--DRBD:优缺点比较、注意事项以及最佳实践
- github简单使用
- user-agent解析工具
- python url解码