當前位置:首頁 » 操作系統 » 的簡單演算法

的簡單演算法

發布時間: 2024-11-22 05:01:14

㈠ 簡單明了的分類演算法:OneR

分類演算法的目的就是根據訓練集的特徵將新的數據進行預測,當然能夠找到特徵之間的聯系越多那麼最後的分類結果也就應該越准確。但是有沒有一個比較簡單的演算法,能夠使用極少的特徵就能夠進行簡單的分類呢?那就是OneR演算法了。

OneR的全稱為:One Rule,顧名思義也就是一條規則的意思。也就是說我們最終僅僅根據訓練集中的一個特徵就能夠實現對數據的分類。如果只是使用一條規則的話,很顯然這個分類的准確度不會很高,但是在某些特定的數據集中這個簡單的演算法也能夠得到比較好的表現。

為了明白這個演算法的工作原理,首先舉一個比較簡單的例子:就拿人的身高和眼睛大小以及膚色的數據對人進行分類是男是女。其中的編號不屬於特徵范疇,只是為了後續介紹數據使用。

編號 身高 眼睛大小 膚色 性別
1 180 正常 偏白 男
2 175 較大 偏黑 男
3 170 正常 偏黑 男
4 170 較大 偏黑 女
5 165 正常 偏白 女
6 160 較大 偏白 女
上述表格中隨機寫了一系列數據,我們來根據這些數據介紹一下OneR演算法。

既然OneR演算法是根據一個規則,也就是某一個特徵來進行分類的,那麼如何找到這個規則就比較重要了。

就拿上述的例子來看,我們有:身高、眼睛大小、膚色這三種特徵,身高是屬於連續值的范疇,眼睛大小是屬於離散數據為:正常、較大,膚色也是離散數據:偏白、偏黑。

我們首先使用簡單的方法將其轉換為離散值,將大於(或等於)身高平均值的記為1,小於身高平均值的記為0,那麼現在的數據就是這樣。

編號 身高 眼睛大小 膚色 性別
1 1 正常 偏白 男
2 1 較大 偏黑 男
3 1 正常 偏黑 男
4 1 較大 偏黑 女
5 0 正常 偏白 女
6 0 較大 偏白 女
接下來我們就需要根據這些數據找到一個可以用來分類的特徵規則。這個特徵究竟是根據身高、眼睛大小、膚色呢?

其實根據我們的生活常識,知道在這三種特徵中身高的可靠性比較高的。但是如何根據計算找到身高這個特徵呢?

如何找到用來分類的規則(特徵)。

其實簡單的想一下就知道了,當然是使用這個特徵之後我們的劃分結果的正確率是最高的。我們需要進行一些簡單的計算,要確保使用這個特徵進行分類得到的准確率最高。因為只有準確率最高我們才能夠得到比較正確的分類結果,所以我們的任務就可以轉換為找到一個特徵,根據這個特徵進行分類的時候能夠得到最高的正確率。

但是要明白,某個特徵可能會有多個特徵值,所以計算特徵的准確率的話,需要包含其中的所有特徵值可能性。也就是說這個特徵的准確率是根據所有的特徵值計算出來的。而對於某個特徵對應的特徵值來看,當然是選擇分類最多的那個作為本次特徵值的分類結果,然後再根據本次特徵值的分類結果計算出錯誤個數。最後匯總到一起計算出該特徵的准確率。

下面對上述樣本集中的身高、眼睛大小、膚色分別計算準確率。

身高。

我們可以看到身高這個特徵共有兩種特徵值:0和1。

如果身高特徵值為1的話,那麼符合特徵值的數據編號為:{1,2,3,4},對應的分類為:{男,男,男,女}。很明顯如果身高這個特徵值為1的話,在本次樣本集中男生佔了3/4,女生佔了1/4。那麼我們就選擇分類結果最多的那個作為身高特徵值為1的劃分結果,也就是性別為男。所以現在可以簡單的認為如果身高特徵值為1的話,我們就簡單的認為性別為男。但是很顯然這個結論是有錯誤的,在本次樣本集中這個結論的錯誤個數為1,因為在身高特徵值為1的情況下有1樣本的性別為女,與我們的結論不符。

如果身高特徵值為0的話。那麼符合特徵值的數據編號為:{5,6},對應的分類為:{女,女}。這個計算結果比較明顯了。如果身高特徵值為0的話,女生佔了2/2。那麼我們就選擇性別為女作為身高特徵值為0的分類結果。也就是說如果身高的特徵值為0的話,我們就認為性別為女。這個結論可能有錯誤,但是在本次的數據集中是全部正確的。

在計算完身高的全部特徵值之後就可以計算準確率了,我們在身高特徵值為0的情況下,我們將其劃分為女,這個准確率為百分之百。在身高特徵值為1的情況下我們將其劃分為男,有一個數據是錯誤的。所以如果按照身高進行劃分的話,得到的准確率為:5/6=0.833。

眼睛大小。

眼睛大小這個特徵共有兩種特徵值:正常、較大。

如果眼睛大小是正常的話,符合特徵值的數據編號為:{1,3,5},對應的分類結果為:{男,男,女}。同樣的男生佔了2/3,女生佔了1/3,那麼就簡單的認為如果眼睛大小為正常的話,就認為性別為男性。同樣的在本次數據集中,這個結論的錯誤個數為1,因為當前特徵值分類結果中有一個是女性。

如果眼睛大小是較大的話,符合特徵值的數據編號為:{2,4,6},對應的分類結果為:{女,女,男}。同樣的女生佔了2/3,男生佔了1/3,那麼就簡單的認為如果眼睛大小為較大的話,就認為性別為女性。同樣的在本次數據集中,這個結論的錯誤個數為1。

有關眼睛大小的所有特徵值計算完成之後就可以計算準確率了。我們在眼睛大小為正常的情況下,將其劃分為男,這個結論在樣本集中有一個數據是錯誤的;同樣的在眼睛大小為較大的情況下,將其劃分為女,這個結論在樣本集中有一個數據是錯誤的。所以如果按照眼睛大小進行劃分的話,准確率為:4/6=0.667。

膚色。

膚色特徵共有兩個特徵值:偏黑、偏白。

如果膚色偏黑的話,符合特徵值的數據編號為:{2,3,4},對應的分類結果為:{男,男,女}。男生佔了2/3,女生1/3。所以如果膚色偏黑的話,就簡單認為是男生,這個結論的錯誤個數為1。

如果膚色偏白的話,符合特徵值的數據編號為:{1,5,6},對應的分類結果為:{男,女,女}。男生佔了1/3,女生佔了2/3,。所以如果膚色偏白的話,就簡單的認為是女生,這個結論的錯誤個數為1。

所以膚色的准確率為:4/6=0.667。

現在得到了各個特徵的准確率。身高的劃分准確率為:0.833;膚色和眼睛大小的准確率都為:0.667。所以我們使用身高作為劃分特徵。

也就是如果有新的數據,我們只看身高這一項數據就將其進行分類。但是分類器的准確率的話是需要使用測試數據進行計算的,我們計算出來的0.833隻是根據訓練樣本集的准確率,只是為了找出用來劃分的規則。

㈡ 超級簡單的HMM演算法詳解(包懂!)

簡易HMM演算法詳解

故事背景描述了一個男生根據心情預測天氣的游戲。女友根據男生的心情,預測天氣是晴天還是雨天。通過男生的心情變化,女友推斷天氣變化。

女友通過男生的心情變化預測天氣變化,這體現了隱馬爾可夫模型(HMM)的基本思想。HMM模型包含觀測值、隱藏狀態、轉換概率和輸出概率四個概念。轉換概率描述了隱藏狀態之間的轉移,輸出概率描述了從隱藏狀態到觀測值的概率。

通過收集歷史數據,可以統計並計算出轉換概率和輸出概率。例如,統計男生在不同天氣下的心情比例,得到天氣對心情的影響概率。

解決四個問題,包括如何估計轉換概率和輸出概率、在沒有心情信息時晴天和雨天的概率、男生心情為高興時的天氣概率以及連續三天心情為「高興-煩躁-高興」的天氣情況。其中,使用貝葉斯定理計算男生心情為高興時的天氣概率。

為了解決連續多天天氣的預測問題,通常使用窮舉法,但在實際應用中效率較低。因此,引入維特比演算法(Viterbi algorithm)作為更高效的解決方案,通過迭代計算最有可能的天氣鏈。

維特比演算法的核心是迭代法,通過計算每一步的最有可能的路徑概率,最終找到連續多天最有可能的天氣鏈。在具體實現上,可以通過Python代碼實現,使用numpy數組來處理多狀態和多觀測值的情況。

通過本教程,讀者可以掌握HMM的基本概念、如何估計模型參數、以及如何應用維特比演算法進行預測。這些知識對於理解自然語言處理、生物信息學、金融預測等領域中的時間序列分析至關重要。

如果你對HMM有更多疑問或者想深入學習,請繼續關注更多教程和資源,或者直接向我提問。希望這個教程能幫助你理解HMM的基本原理和實際應用。

熱點內容
ipad設置文件夾密碼 發布:2024-12-24 20:07:52 瀏覽:532
幻塔h201避難所密碼鎖是多少 發布:2024-12-24 20:01:53 瀏覽:852
電腦配置怎麼看硬碟 發布:2024-12-24 20:00:22 瀏覽:865
青海雲伺服器租用公司 發布:2024-12-24 19:59:42 瀏覽:818
資料庫記錄排序 發布:2024-12-24 19:50:06 瀏覽:599
byte轉stringpython 發布:2024-12-24 19:48:30 瀏覽:668
戰地一配置低顯示器解析度怎麼調 發布:2024-12-24 19:48:19 瀏覽:427
如何判斷腳本是否開了 發布:2024-12-24 19:47:32 瀏覽:654
安卓怎麼退出純凈模式 發布:2024-12-24 19:31:37 瀏覽:308
sql存儲過程結果輸出 發布:2024-12-24 19:10:52 瀏覽:554