Weka学习-Eclipse中配置weka

Weka(Waikato Environment for Knowledge Analysis)是由新西兰怀卡托大学用Java开发的数据挖掘常用软件,Weka是怀卡托智能分析系统的缩写,它限制在GNU通用公众证书的条件下发布,它几乎可以运行在所有操作系统平台上,包括Linux、Windows、OS X等。源代码可在其官方网站下载。Weka是数据挖掘任务的机器学习算法的集合。 这些算法可以直接应用于数据集,也可以从自己的Java代码中调用。 Weka包含用于数据预处理,分类,回归,聚类,关联规则和可视化的工具。 它也非常适合开发新的机器学习方案。

http://www.cs.waikato.ac.nz/ml/weka/

一、下载安装

点击链接进入Weka官网下载链接,首页可以看到3-8,3-9的版本,3-8为最新稳定版,3-9为最新测试版,如果使用3-8的版本必须使用 jdk1.7 ,这里使用weka-3-4-14的版本,之前的版本比较旧了,weka-3-8的里面没有找到ID3等算法。

安装比较简单,一路下一步即可。

二、Eclipse导入Weka

解压Weka源码包 weka-src.jar文件,直接以压缩文件解压,打开eclipse,新建Java Project 命名为 Weka_3.4 ,右键 src 文件夹 ,选择 import

选择 General -> filesystem

选择 weka-src/src/main/java 目录(各个Weka版本目录结构可能不同,需要自行判断,大部分版本与此目录相同,少数版本不同)

勾上 java 文件夹 ,点击 Finish。

三、运行Weka

依次打开Weka_3.4项目,打开src文件夹,打开weka.gui包,找到GUIChooser.java,右键选择 Run As->Java Application ,即可打开Weka。

注意 如果导入过后出现错误,无法运行,看weka-src目录下是否有lib文件夹

如果有,右键weka项目,Build->Configure Build Path->Add External JARs,选择weka-src/lib下所有 .jar 文件。

如果没有lib文件夹,可能是jdk版本的问题,可能要重装JDK。具体要看错误日志,以上只是常见错误。

四、添加自己的算法

1.创建包,类

在工程项目Weka中新建一个包,命名为weka.classifiers.ling,新建一个class命名为Myid3,这里为了方便,直接拷贝 weka.classifiers.trees 包下 Id3 算法的java代码,适当修改即可。

2.修改配置文件

修改weka项目下weka\src\weka.gui包里面的 GenericPropertiesCreator.propsGenericObjectEditor.props 两个两个配置文件。

在文件 GenericPropertiesCreator.props 中找到 # Lists the Classifiers-Packages I want to choose from 这一项,然后按照文件上面的格式,在最后一行 weka.classifiers.rules 后新增 weka.classifiers.ling 保存。

同样的,在文件 GenericObjectEditor.props 中找到 # Lists the Classifiers I want to choose from 这一项,然后按照文件上面的格式,在最后一行 weka.classifiers.rules.ZeroR 后新增 weka.classifiers.ling.MyId3 保存。

3.查看

打开weka.gui包,找到GUIChooser.java,右键选择 Run As->Java Application,运行weka,导入数据后,在Classify列下点击choose,可以看到添加的ling目录下有Myid3算法。

坚持原创技术分享,您的支持将鼓励我继续创作!