隱馬爾科夫演算法
A. em演算法是什麼
最大期望演算法(Expectation-Maximization algorithm, EM),或Dempster-Laird-Rubin演算法,是一類通過迭代進行極大似然估計(Maximum Likelihood Estimation, MLE)的優化演算法 ,通常作為牛頓迭代法(Newton-Raphson method)的替代用於對包含隱變數(latent variable)或缺失數據(incomplete-data)的概率模型進行參數估計。
EM演算法的標准計算框架由E步(Expectation-step)和M步(Maximization step)交替組成,演算法的收斂性可以確保迭代至少逼近局部極大值 。EM演算法是MM演算法(Minorize-Maximization algorithm)的特例之一,有多個改進版本,包括使用了貝葉斯推斷的EM演算法、EM梯度演算法、廣義EM演算法等 。
由於迭代規則容易實現並可以靈活考慮隱變數,EM演算法被廣泛應用於處理數據的缺測值 ,以及很多機器學習(machine learning)演算法,包括高斯混合模型(Gaussian Mixture Model, GMM) 和隱馬爾可夫模型(Hidden Markov Model, HMM) 的參數估計。
B. 條件隨機場和隱馬爾科夫模型最大區別在哪裡
隱馬爾可夫模型(Hidden Markov Model,HMM),最大熵馬爾可夫模型(Maximum Entropy Markov Model,MEMM)以及條件隨機場(Conditional Random Field,CRF)是序列標注中最常用也是最基本的三個模型。HMM首先出現,MEMM其次,CRF最後。三個演算法主要思想如下:HMM模型是對轉移概率和表現概率直接建模,統計共現概率。MEMM模型是對轉移概率和表現概率建立聯合概率,統計時統計的是條件概率,但MEMM容易陷入局部最優,是因為MEMM只在局部做歸一化。CRF模型中,統計了全局概率,在 做歸一化時,考慮了數據在全局的分布,而不是僅僅在局部歸一化,這樣就解決了MEMM中的標記偏置(label bias)的問題。舉個例子,對於一個標注任務,「我愛北京天安門「, 標注為」 s s b e b c e」對於HMM的話,其判斷這個標注成立的概率為 P= P(s轉移到s)*P(『我』表現為s)* P(s轉移到b)*P(『愛』表現為s)* …*P().訓練時,要統計狀態轉移概率矩陣和表現矩 陣。對於MEMM的話,其判斷這個標注成立的概率為 P= P(s轉移到s|』我』表現為s)*P(『我』表現為s)* P(s轉移到b|』愛』表現為s)*P(『愛』表現為s)*..訓練時,要統計條件狀態轉移概率矩陣和表現矩陣。對於CRF的話,其判斷這個標注成立的概率為 P= F(s轉移到s,』我』表現為s)….F為一個函數,是在全局范圍統計歸一化的概率而不是像MEMM在局部統計歸一化的概率。當前,最後出現的CRF在多項任務上達到了統治級的表現,所以如果重頭搞應用的話,大家可以首選CRF。
本質上,CRF有以下三個優點:
CRF沒有HMM那樣嚴格的獨立性假設條件,因而可以容納任意的上下文信息。特徵設計靈活(與ME一樣) ————與HMM比較
同時,由於CRF計算全局最優輸出節點的條件概率,它還克服了最大熵馬爾可夫模型標記偏置(Label-bias)的缺點。 ————與MEMM比較
CRF是在給定需要標記的觀察序列的條件下,計算整個標記序列的聯合概率分布,而不是在給定當前狀態條件下,定義下一個狀態的狀態分布。
凡事都有兩面,正由於這些優點,CRF需要訓練的參數更多,與MEMM和HMM相比,它存在訓練代價大、復雜度高的缺點。
C. 馬爾科夫鏈屬於機器學習嘛
馬爾可夫鏈是一組具有馬爾可夫性質的離散隨機變數的集合。具體地,對概率空間 內以一維可數集為指數集(index set) 的隨機變數集合 ,若隨機變數的取值都在可數集內: ,且隨機變數的條件概率滿足一定的關系則 被稱為馬爾可夫鏈。
目前不少機器學習演算法,包括隱馬爾可夫模型(Hidden Markov Model, HMM)、馬爾可夫隨機場(Markov Random Field, MRF)和馬爾可夫決策(Markov decision process, MDP)以馬爾可夫鏈為理論基礎。
D. 語音識別——隱馬爾科夫
HMM模型,就是估計向量流與已經存在的HMM模型的動態的匹配概率。
語音經常用MFCC作觀察向量。常見的是13維,加上 一級差分,和二級差分,共39維,最常見了。
E. 什麼是hidden markov models
這是隱馬爾科夫模型
用在語音信號方面的,是為了分析語音信號而提出的一個演算法模型.在語音信號處理上用的比較多
隱馬爾可夫模型(HMM)是對語音信號的時間序列結構建立統計模型,可將之看作一個數學上的雙重隨機過程:一個是用具有有限狀態數的Markov鏈來模擬語音信號統計特性變化的隱含的隨機過程,另一個是與Markov鏈的每一個狀態相關聯的觀測序列的隨機過程.前者通過後者表現出來,但前者的具體參數是不可測的.人的言語過程實際上就是一個雙重隨機過程,語音信號本身是一個可觀測的時變序列,是由大腦根據語法知識和言語需要(不可觀測的狀態) 發出的音素的參數流.可見HMM合理地模仿了這一過程,很好地描述了語音信號的整體非平穩性和局部平穩性,是較為理想的一種語音模型.從整段語音來看,人類語音是一個非平穩的隨機過程,但是若把整段語音分割成若干短時語音信號,則可認為這些短時語音信號是平穩過程,我們就可以用線性手段對這些短時語音信號進行分析.若對這些語音信號建立隱馬爾可夫模型,則可以辯識具有不同參數的短時平穩的信號段,並可以跟蹤它們之間的轉化,從而解決了對語音的發音速率及聲學變化建立模型的問題。
F. 如何用簡單易懂的例子解釋隱馬爾可夫模型
和HMM模型相關的演算法主要分為三類,分別解決三種問題:
1)知道骰子有幾種(隱含狀態數量),每種骰子是什麼(轉換概率),根據擲骰子擲出的結果(可見狀態鏈),我想知道每次擲出來的都是哪種骰子(隱含狀態鏈)。
這個問題呢,在語音識別領域呢,叫做解碼問題。這個問題其實有兩種解法,會給出兩個不同的答案。每個答案都對,只不過這些答案的意義不一樣。第一種解法求最大似然狀態路徑,說通俗點呢,就是我求一串骰子序列,這串骰子序列產生觀測結果的概率最大。第二種解法呢,就不是求一組骰子序列了,而是求每次擲出的骰子分別是某種骰子的概率。比如說我看到結果後,我可以求得第一次擲骰子是D4的概率是0.5,D6的概率是0.3,D8的概率是0.2.第一種解法我會在下面說到,但是第二種解法我就不寫在這里了,如果大家有興趣,我們另開一個問題繼續寫吧。
2)還是知道骰子有幾種(隱含狀態數量),每種骰子是什麼(轉換概率),根據擲骰子擲出的結果(可見狀態鏈),我想知道擲出這個結果的概率。
看似這個問題意義不大,因為你擲出來的結果很多時候都對應了一個比較大的概率。問這個問題的目的呢,其實是檢測觀察到的結果和已知的模型是否吻合。如果很多次結果都對應了比較小的概率,那麼就說明我們已知的模型很有可能是錯的,有人偷偷把我們的骰子給換了。
3)知道骰子有幾種(隱含狀態數量),不知道每種骰子是什麼(轉換概率),觀測到很多次擲骰子的結果(可見狀態鏈),我想反推出每種骰子是什麼(轉換概率)。
這個問題很重要,因為這是最常見的情況。很多時候我們只有可見結果,不知道HMM模型里的參數,我們需要從可見結果估計出這些參數,這是建模的一個必要步驟。
問題闡述完了,下面就開始說解法。(0號問題在上面沒有提,只是作為解決上述問題的一個輔助)
G. 誰能幫我找一些關於馬爾可夫模型的資料啊
摘 要:根據隱馬爾可夫模型HMM的基本理論和演算法設計了一個情感模型.該模型用E-HMM構成:子層(即低層)HMM由3個HMM組成,分別對應3種心理情緒狀態.外部刺激經過子層初步識別,其輸出組成高級層HMM的觀察向量,經過高層HMM,確定情感輸出,從而提高了模型的准確性.
關鍵詞:隱馬爾可夫模型;情感計算;情感模型
分類號:TP391.9 文獻標識碼:A
文章編號:1002-3186(2005)01-0061-04
作者簡介:王玉潔,女,教授,主研方向為人工智慧及機器人技術
作者單位:王玉潔(北京農學院基礎科學系,北京,102206;北京科技大學信息工程學院,北京,100083)
王志良(北京科技大學信息工程學院,北京,100083)
陳鋒軍(北京科技大學信息工程學院,北京,100083)
王國江(北京科技大學信息工程學院,北京,100083)
王玉鋒(北京科技大學信息工程學院,北京,100083)
參考文獻:
[1]Picard R W. Affective computing[M]. MIT Press, London,England, 1997
[2]L R Rabiner. A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition. Proceedings of the IEEE, 1989,77(2) :257
[3]Chellappa R, Zhao W. Face Recognition: A Literature Survey. TO be submitted to ACM Journal of Computing Surveys, 2000
[4]Agazzi O,Kuo S. Hidden Markov Models Based Optical Character Recognition in Presence of Deterministic Transformation. Pattern Recognition, 1993,26 (12): 1813-1826
[5]Samaria F, Hatter A. Parameterisation of a Stochanastic Model for Human Face Identification. Sarasota, Florida: IEEE Workshop on Application of Computer Vision, 1994
[6]Nefian A V. A Hidden Markov Model-Based Approach for Face Detection and Recognition [PhD thesis]. school of Electrical and Computer Engineering, Georigia Institute of Technology, 1998
[7]Levin E, Pieraccini R. Dynamic Planar Warping for Optical Character Recognition. Proceeding of ICASSP92,1992, ( 3 ):149-152
[8]葉俊勇,汪同慶,彭健,楊波.基於偽二維隱馬爾可夫模型的人臉識別.計算機工程,2003,(1):26-27
--------------------------------------------------------------------------------
題目 計算機系統入侵檢測的隱馬爾可夫模型
A Hidden Markov Model Used in Intrusion Detection
作者 譚小彬1 王衛平2 奚宏生1 殷保群1
TAN Xiao-Bin1, WANG Wei-Ping2, XI Hong-Sheng1, and YIN Bao-Qun1
單位 (中國科學技術大學自動化系 合肥 230027); 2(中國科學技術大學商學院 合肥 230026) ([email protected]
1(Department of Automation, University of Science & Technology of China, Hefei 230027) 2(School of Business and Management, University of Science & Technology of China, Hefei 230026)
關鍵詞 入侵檢測;異常檢測;隱馬爾可夫模型(HMM)
intrusion detection; anomaly detection; hidden Markov model (HMM)
摘要 入侵檢測技術作為計算機安全技術的一個重要組成部分,現在受到越來越廣泛地關注.首先建立了一個計算機系統運行狀況的隱馬爾可夫模型(HMM),然後在此模型的基礎上提出了一個用於計算機系統實時異常檢測的演算法,以及該模型的訓練演算法.這個演算法的優點是准確率高,演算法簡單,佔用的存儲空間很小,適合用於在計算機系統上進行實時檢測.
As the key component of computer security technique, intrusion detection has received more and more attention. In this paper, an overview of research in anomaly detection is presented with emphasis on issues related to found a hidden Markov model (HMM) for the normal states of computer system, and an algorithm of anomaly detection is brought forward. The probability of observed sequence is computed and the average probability of a fixed length sequence is used as the metric of anomaly detection. To improve accuracy, an update algorithm for this hidden Markov model is also presented based on the forgetting factor. This method is not only useful in theory, but also can be used in practice to monitor the computer system in real time.
H. 請問關於隱馬爾科夫的知識,尤其是viterbi演算法的詳細推導在什麼書里能查到啊
《現代模式識別》,介紹的比較詳細