weka關聯演算法
A. 關於數據挖掘軟體《weka》關聯規則挖掘功能
先把各個屬性的取值都是0的那些給去掉,剩下的就是取值為1了吧。
B. 如何向weka中添加新演算法
編寫新演算法,所編寫的新演算法必須符合Weka 的介面標准。在此以從Weka中文站上下載的一個演算法(模糊C均值聚類演算法:FuzzyCMeans)的添加為例說明其具體過程。
2. 由於FuzzyCMeans是聚類演算法,所以直接將FuzzyCMeans.java 源程序考到 weka.clusterers 包下
3. 再修改weka.gui.GenericObjectEditor.props ,在#Lists the Clusterers I want to choose from的weka.clusterers.Clusterer=\下加入:weka.clusterers.FuzzyCMeans
4. 相應的修改weka.gui.GenericPropertiesCreator.props ,此去不用修改,因為包weka.clusterers已經存在,若加入新的包時則必須修改這里,加入新的包
我試了一下,這樣加入之後,重新編譯,運行後,可以在weka的Explorer界面上的Cluster選項卡中的聚類演算法中找到剛剛新添加的FuzzyCMeans演算法。
添加過程簡單吧!關鍵問題是要弄清楚Weka的內核以及其介面標准,然後編寫出符合此規范的新演算法。
C. 怎麼調用weka中的演算法怎麼用weka處理大數據集
weka演算法調用,可以參見博客
http://quweiprotoss.blog.163.com/blog/#m=0&t=1&c=fks_
裡面內容很詳細,至於大數據,你是要在hadoop上搭平台還是,我也不清楚。一般小數據採用weka,因為這個基本上就是實驗性質的工具,不是商用的。
D. 請問你的weka種演算法的實現過程是怎麼樣的呢
weka我只是拿來做實驗,因為weka中的演算法效率不是很好,我自己實現的演算法並沒有拿weka做為框架
E. 請問weka那個軟體中如何實現CBA(關聯分類)演算法
和版本有關,新的3.7.3版本裡面有。
F. weka里Apriori關聯規則挖掘,我希望得到的結論是與最後一列目標屬性的關系,可是總是得到的都是前邊條件屬
weka裡面的apriori演算法,先生成所有的頻繁項集,然後生成規則,根據最小支持度和置信度都滿足的情況,選出強規則輸出。
舉個例子,比如有個長度為3的頻繁項集ABC
那麼你生成規則時候是:
A->BC
AB->C
AC->B
B->AC
BC->A
C->AB
然後分別對上述產生的規則計算置信度,如果不滿足,就不輸出
那麼你所說的問題,很可能是因為你的最後一列在->右邊時的規則不滿足置信度。
所以沒有那樣的規則輸出。
weka默認的最小支持度是0.1,最小置信度是0.9,你可以通過命令行進行調整,適當降低
置信度,可能就能看到你想要的規則了。
G. weka&數據挖掘:Weka裡面有很多的演算法,但是Weka並沒有給出演算法如何實現的,有沒有相關的論文可以看看啊!
我覺得直接看源碼比較容易理解,WEKA是開源的
如果你要信息增益的話看這個:
http://www.360doc.com/content/09/1010/11/79028_7055867.shtml
H. 請問如何向weka中添加新演算法
1.編寫新演算法,所編寫的新演算法必須符合Weka的介面標准。在此以從Weka中文站(貌似已經打不開了,做實驗可以簡單復制一個clusterers目錄下已有的演算法改個名就好了)上下載的一個演算法(模糊C均值聚類演算法:FuzzyCMeans)的添加為例說明其具體過程。
2.由於FuzzyCMeans是聚類演算法,所以直接將FuzzyCMeans.java 源程序考到 weka.clusterers 包下。
3.再修改weka.gui.GenericObjectEditor.props ,在#Lists the Clusterers I want to
choose from的weka.clusterers.Clusterer=\下加入:weka.clusterers.FuzzyCMeans。
4.相應的修改weka.gui.GenericPropertiesCreator.props
,此去不用修改,因為包weka.clusterers已經存在,若加入新的包時則必須修改這里,加入新的包。
加入之後,重新編譯,運行後,可以在weka的Explorer界面上的Cluster選項卡中的聚類演算法中找到剛剛新添加的FuzzyCMeans演算法。
添加過程的關鍵問題是要弄清楚Weka的內核以及其介面標准,然後編寫出符合此規范的新演算法。
演算法規范和weka源代碼正在分析學習中。
I. 用weka做數據關聯時 為什麼Apriori演算法沒法用
得轉換成標稱(nominal)類型,weka把exel中的數字看作是數據類型,不能處理。
J. 用weka分析,為什麼數據導進來後關聯分析模塊的start按鈕為灰
說明你的數據集不符合該方法的要求。對於關聯規則挖掘來講,通常都是因為數據是數值型的且未離散化。相關的問題我已經回答過很多次了,具體你可以參考我之前的回答,不明白可以繼續追問:
http://..com/question/554012782?&oldq=1
http://..com/question/548971966?&oldq=1