您的位置:首页 > 其它

数据挖掘算法学习(二)weka简介

2014-07-27 17:35 267 查看
weka官方下载地址:http://www.cs.waikato.ac.nz/ml/weka/downloading.html

weka简介:

Weka的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),是一款免费的,非商业化(与之对应的是SPSS公司商业数据挖掘产品--Clementine )的,基于JAVA环境下开源的机器学习(machine learning)以及数据挖掘(data minining)软件。它和它的源代码可在其官方网站下载。WEKA作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、关联规则以及在新的交互式界面上的可视化。

文件格式:

weka的文件格式是.arff。arff文件内部结构很简单,主要是测试算法使用的轻量级的数据文件结构。arff格式文件主要由两个部分构成,头部定义和数据区。头部定义包含了关系名称(relation name)、一些属性(attributes)和对应的类型。

如:

@relation weather.symbolic

@attribute outlook {sunny, overcast, rainy}

@attribute temperature {hot, mild, cool}

@attribute humidity {high, normal}

@attribute windy {TRUE, FALSE}

@attribute play {yes, no}

@data

sunny,hot,high,FALSE,no

sunny,hot,high,TRUE,no

overcast,hot,high,FALSE,yes

rainy,mild,high,FALSE,yes

rainy,cool,normal,FALSE,yes

rainy,cool,normal,TRUE,no

overcast,cool,normal,TRUE,yes

sunny,mild,high,FALSE,no

sunny,cool,normal,FALSE,yes

rainy,mild,normal,FALSE,yes

sunny,mild,normal,TRUE,yes

overcast,mild,high,TRUE,yes

overcast,hot,normal,FALSE,yes

rainy,mild,high,TRUE,no

%是注释符号。数据区有@data开头。NUMERIC说明其为数字型,属性class的取值是限定的,只能是Iris-setosa,Iris-versicolor,Iris-virginica中的一个。数据类型还可以是string和data。

软件主界面:



载入数据之后的Explorer界面:



在explorer选项中,可以选择过滤器,分类算法,聚类算法等,是weka中最为常用的功能。

试验(Experiment)环境可以让用户创建,运行,修改和分析算法试验,这也许比单独的分析各个算法更加方便。
KnowledgeFlow 为 Weka 提供了一个"数据流"形式的界面.用户可以从一个工具栏中选择组件,把它们放置在面板上并按一定的顺序连接起来,这样组成一个"知识流"(knowledge °ow)来处理和分析数据。
Simple CLI提供了一个命令行输入的地方。输入规则如下:
• java <classname> [<args>]

invokes a java class with the given arguments (if any)

• break

stops the current thread, e.g., a running classifier, in a friendly manner

• kill

stops the current thread in an unfriendly fashion

• cls

clears the output area

• capabilities <classname> [<args>]

lists the capabilities of the specified class, e.g., for a classifier with its

options:

capabilities weka.classifiers.meta.Bagging -W weka.classifiers.trees.Id3

• exit

exits the Simple CLI

• help [<command>]

provides an overview of the available commands if without a command

name as argument, otherwise more help on the specified command
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  数据挖掘 weka