weka源碼分析
Ⅰ 我裝的是WEKA3.6.8和JDK1.7,運行WEKA的時候提示 class not found program will exit
配置:
先下載weka開發包,在安裝目錄下有個weka-src.jar包(源代碼)和weka.jar包(可執行文件),將weka-src.jar包解壓,然後把\weka-src\src\main\java\weka文件夾拖入到waka工程的src目錄下.將weka.jar文件解壓後,將\weka\weka文件夾拷貝到weka工程磁碟目錄下的bin文件夾下。然後在所建工程的Build Path中把weka_javacodes.jar導入。最後在myeclipse或eclipse中編寫代碼運行即可。
Ⅱ weka能否進行實例過濾
這個肯定是有的。不知道你是用weka作編程開發還是只用GUI作數據挖掘
如果是用GUI的話如圖就是選擇一種FILTER實現過濾實例(對原始數據進行預處理),可以看到filter有監督的和非監督的,你可以根據需求選擇對應的filter,選好後點擊那個filter的框就可以設置具體參數和規則什麼的
如果你是用weka作開發,http://weka.sourceforge.net/doc.stable/這個是weka的API可以看到weka.filters的包然後具體的應用你自己看API就可以了
如果用GUI選擇filter選暈了不知道用哪個那也去看看API吧解釋的還是可以的是在不行去下載一個weka的源碼看看注釋不過全是E文
Ⅲ 請教weka軟體中,其中的SMOTE演算法釋義classValue
是的,weka是開源的. 記得我用過的那個版本在安裝目錄的bin文件夾里有一個weka.jar, 解壓後得到的就是源碼. c4.5在weka里的實現是j48, 大致是這個路徑吧:weka.classifiers.trees.j48
您可以把整個weka.jar作為外部library導入類似Eclipse這樣的開發環境, 這樣看源碼或者用weka的api進行二次開發都很方便的.
Ⅳ 誰能幫我翻一下weka的結果,不要用翻譯軟體,真正懂weka的來幫我翻譯下,答得好的有加分,我有1000的財富
=== Run information ===運行信息(如下)
Scheme(前提,場景):weka.classifiers(weka分類標准).functions(功能).Lib(library,素材庫)SVM(support vector machine矢量演算法支持機) -S 0 -K 2 -D 3 -G 0.0 -R 0.0 -N 0.5 -M 40.0 -C 1.0 -E 0.0010 -P 0.1
Relation(關聯): Glass(玻璃)
Instances實驗次數: 214
Attributes特徵屬性: 10
RI(Refractive index 折射率 )
Na 鈉
Mg鎂
Al鋁
Si硅
K鉀
Ca鈣
Ba鋇
Fe鐵
Type類型
Test mode實驗模式:10-fold cross-validation(十倍交叉驗證)
=== Classifier model (full training set) ===分類模型(全部一整套的訓練指標)
LibSVM wrapper(打包的矢量機素材庫), original code by Yasser EL-Manzalawy (= WLSVM)
(源碼由byYasser EL-Manzalawy 提供)WLSVM(wrapper library support vector machine,打包的支持矢量機的素材庫)
Time taken to build model:(建立模型消耗時間) 0.02 seconds(秒)
=== Stratified cross-validation ===窄條交叉驗證
=== Summary ===實驗總結
Correctly Classified Instances 正確分類的次數 148 69.1589 %
Incorrectly Classified Instances 錯誤分類的次數 66 30.8411 %
Kappa statistic kappa 靜止值 0.3579
Mean absolute error 平均絕對錯誤值 0.0881
Root mean squared error 根平均平方差 0.2968
Relative absolute error 相關絕對錯誤值 60.7715 %
Root relative squared error 根相對錯誤值 111.5949 %
Total Number of Instances 總計實驗次數 214
=== Detailed Accuracy By Class ===分類後的詳細精準度
TP Rate(TP率) FP Rate(FP率) Precision(精確值) Recal(上次結果)l F-Measure (F-測量到的參數) ROC(不太清楚這個) Area(面積) Class(分類)
0.847 0.5 0.676 0.847 0.752 0.674 build wind float 風浮點建模
0.5 0.153 0.727 0.5 0.593 0.674 build wind non-float 風非浮點建模
0 0 0 0 0 ? vehic wind float 運載工具風浮點建模
0 0 0 0 0 ? vehic wind non-float運載工具風非浮點建模
0 0 0 0 0 ? containers 容器(建模後,的小環境)
0 0 0 0 0 ? tableware(桌上的物件)
0 0 0 0 0 ? headlamps(汽車前燈)
Weighted Avg.(平均權重) 0.692 0.344 0.699 0.692 0.68 0.674
=== Confusion Matrix ===混合後的基底值
a b c d e f g <-- classified as分類如下
100 18 0 0 0 0 0 | a = build wind float風浮點建模
48 48 0 0 0 0 0 | b = build wind non-float風非浮點建模
0 0 0 0 0 0 0 | c = vehic wind float運載工具風浮點建模vehicle=vehic
0 0 0 0 0 0 0 | d = vehic wind non-float運載工具風非浮點建模
0 0 0 0 0 0 0 | e = containers容俱
0 0 0 0 0 0 0 | f = tableware桌面物品
0 0 0 0 0 0 0 | g = headlamps汽車大燈