weka关联算法
A. 关于数据挖掘软件《weka》关联规则挖掘功能
先把各个属性的取值都是0的那些给去掉,剩下的就是取值为1了吧。
B. 如何向weka中添加新算法
编写新算法,所编写的新算法必须符合Weka 的接口标准。在此以从Weka中文站上下载的一个算法(模糊C均值聚类算法:FuzzyCMeans)的添加为例说明其具体过程。
2. 由于FuzzyCMeans是聚类算法,所以直接将FuzzyCMeans.java 源程序考到 weka.clusterers 包下
3. 再修改weka.gui.GenericObjectEditor.props ,在#Lists the Clusterers I want to choose from的weka.clusterers.Clusterer=\下加入:weka.clusterers.FuzzyCMeans
4. 相应的修改weka.gui.GenericPropertiesCreator.props ,此去不用修改,因为包weka.clusterers已经存在,若加入新的包时则必须修改这里,加入新的包
我试了一下,这样加入之后,重新编译,运行后,可以在weka的Explorer界面上的Cluster选项卡中的聚类算法中找到刚刚新添加的FuzzyCMeans算法。
添加过程简单吧!关键问题是要弄清楚Weka的内核以及其接口标准,然后编写出符合此规范的新算法。
C. 怎么调用weka中的算法怎么用weka处理大数据集
weka算法调用,可以参见博客
http://quweiprotoss.blog.163.com/blog/#m=0&t=1&c=fks_
里面内容很详细,至于大数据,你是要在hadoop上搭平台还是,我也不清楚。一般小数据采用weka,因为这个基本上就是实验性质的工具,不是商用的。
D. 请问你的weka种算法的实现过程是怎么样的呢
weka我只是拿来做实验,因为weka中的算法效率不是很好,我自己实现的算法并没有拿weka做为框架
E. 请问weka那个软件中如何实现CBA(关联分类)算法
和版本有关,新的3.7.3版本里面有。
F. weka里Apriori关联规则挖掘,我希望得到的结论是与最后一列目标属性的关系,可是总是得到的都是前边条件属
weka里面的apriori算法,先生成所有的频繁项集,然后生成规则,根据最小支持度和置信度都满足的情况,选出强规则输出。
举个例子,比如有个长度为3的频繁项集ABC
那么你生成规则时候是:
A->BC
AB->C
AC->B
B->AC
BC->A
C->AB
然后分别对上述产生的规则计算置信度,如果不满足,就不输出
那么你所说的问题,很可能是因为你的最后一列在->右边时的规则不满足置信度。
所以没有那样的规则输出。
weka默认的最小支持度是0.1,最小置信度是0.9,你可以通过命令行进行调整,适当降低
置信度,可能就能看到你想要的规则了。
G. weka&数据挖掘:Weka里面有很多的算法,但是Weka并没有给出算法如何实现的,有没有相关的论文可以看看啊!
我觉得直接看源码比较容易理解,WEKA是开源的
如果你要信息增益的话看这个:
http://www.360doc.com/content/09/1010/11/79028_7055867.shtml
H. 请问如何向weka中添加新算法
1.编写新算法,所编写的新算法必须符合Weka的接口标准。在此以从Weka中文站(貌似已经打不开了,做实验可以简单复制一个clusterers目录下已有的算法改个名就好了)上下载的一个算法(模糊C均值聚类算法:FuzzyCMeans)的添加为例说明其具体过程。
2.由于FuzzyCMeans是聚类算法,所以直接将FuzzyCMeans.java 源程序考到 weka.clusterers 包下。
3.再修改weka.gui.GenericObjectEditor.props ,在#Lists the Clusterers I want to
choose from的weka.clusterers.Clusterer=\下加入:weka.clusterers.FuzzyCMeans。
4.相应的修改weka.gui.GenericPropertiesCreator.props
,此去不用修改,因为包weka.clusterers已经存在,若加入新的包时则必须修改这里,加入新的包。
加入之后,重新编译,运行后,可以在weka的Explorer界面上的Cluster选项卡中的聚类算法中找到刚刚新添加的FuzzyCMeans算法。
添加过程的关键问题是要弄清楚Weka的内核以及其接口标准,然后编写出符合此规范的新算法。
算法规范和weka源代码正在分析学习中。
I. 用weka做数据关联时 为什么Apriori算法没法用
得转换成标称(nominal)类型,weka把exel中的数字看作是数据类型,不能处理。
J. 用weka分析,为什么数据导进来后关联分析模块的start按钮为灰
说明你的数据集不符合该方法的要求。对于关联规则挖掘来讲,通常都是因为数据是数值型的且未离散化。相关的问题我已经回答过很多次了,具体你可以参考我之前的回答,不明白可以继续追问:
http://..com/question/554012782?&oldq=1
http://..com/question/548971966?&oldq=1