隐马尔科夫算法
A. em算法是什么
最大期望算法(Expectation-Maximization algorithm, EM),或Dempster-Laird-Rubin算法,是一类通过迭代进行极大似然估计(Maximum Likelihood Estimation, MLE)的优化算法 ,通常作为牛顿迭代法(Newton-Raphson method)的替代用于对包含隐变量(latent variable)或缺失数据(incomplete-data)的概率模型进行参数估计。
EM算法的标准计算框架由E步(Expectation-step)和M步(Maximization step)交替组成,算法的收敛性可以确保迭代至少逼近局部极大值 。EM算法是MM算法(Minorize-Maximization algorithm)的特例之一,有多个改进版本,包括使用了贝叶斯推断的EM算法、EM梯度算法、广义EM算法等 。
由于迭代规则容易实现并可以灵活考虑隐变量,EM算法被广泛应用于处理数据的缺测值 ,以及很多机器学习(machine learning)算法,包括高斯混合模型(Gaussian Mixture Model, GMM) 和隐马尔可夫模型(Hidden Markov Model, HMM) 的参数估计。
B. 条件随机场和隐马尔科夫模型最大区别在哪里
隐马尔可夫模型(Hidden Markov Model,HMM),最大熵马尔可夫模型(Maximum Entropy Markov Model,MEMM)以及条件随机场(Conditional Random Field,CRF)是序列标注中最常用也是最基本的三个模型。HMM首先出现,MEMM其次,CRF最后。三个算法主要思想如下:HMM模型是对转移概率和表现概率直接建模,统计共现概率。MEMM模型是对转移概率和表现概率建立联合概率,统计时统计的是条件概率,但MEMM容易陷入局部最优,是因为MEMM只在局部做归一化。CRF模型中,统计了全局概率,在 做归一化时,考虑了数据在全局的分布,而不是仅仅在局部归一化,这样就解决了MEMM中的标记偏置(label bias)的问题。举个例子,对于一个标注任务,“我爱北京天安门“, 标注为” s s b e b c e”对于HMM的话,其判断这个标注成立的概率为 P= P(s转移到s)*P(‘我’表现为s)* P(s转移到b)*P(‘爱’表现为s)* …*P().训练时,要统计状态转移概率矩阵和表现矩 阵。对于MEMM的话,其判断这个标注成立的概率为 P= P(s转移到s|’我’表现为s)*P(‘我’表现为s)* P(s转移到b|’爱’表现为s)*P(‘爱’表现为s)*..训练时,要统计条件状态转移概率矩阵和表现矩阵。对于CRF的话,其判断这个标注成立的概率为 P= F(s转移到s,’我’表现为s)….F为一个函数,是在全局范围统计归一化的概率而不是像MEMM在局部统计归一化的概率。当前,最后出现的CRF在多项任务上达到了统治级的表现,所以如果重头搞应用的话,大家可以首选CRF。
本质上,CRF有以下三个优点:
CRF没有HMM那样严格的独立性假设条件,因而可以容纳任意的上下文信息。特征设计灵活(与ME一样) ————与HMM比较
同时,由于CRF计算全局最优输出节点的条件概率,它还克服了最大熵马尔可夫模型标记偏置(Label-bias)的缺点。 ————与MEMM比较
CRF是在给定需要标记的观察序列的条件下,计算整个标记序列的联合概率分布,而不是在给定当前状态条件下,定义下一个状态的状态分布。
凡事都有两面,正由于这些优点,CRF需要训练的参数更多,与MEMM和HMM相比,它存在训练代价大、复杂度高的缺点。
C. 马尔科夫链属于机器学习嘛
马尔可夫链是一组具有马尔可夫性质的离散随机变量的集合。具体地,对概率空间 内以一维可数集为指数集(index set) 的随机变量集合 ,若随机变量的取值都在可数集内: ,且随机变量的条件概率满足一定的关系则 被称为马尔可夫链。
目前不少机器学习算法,包括隐马尔可夫模型(Hidden Markov Model, HMM)、马尔可夫随机场(Markov Random Field, MRF)和马尔可夫决策(Markov decision process, MDP)以马尔可夫链为理论基础。
D. 语音识别——隐马尔科夫
HMM模型,就是估计向量流与已经存在的HMM模型的动态的匹配概率。
语音经常用MFCC作观察向量。常见的是13维,加上 一级差分,和二级差分,共39维,最常见了。
E. 什么是hidden markov models
这是隐马尔科夫模型
用在语音信号方面的,是为了分析语音信号而提出的一个算法模型.在语音信号处理上用的比较多
隐马尔可夫模型(HMM)是对语音信号的时间序列结构建立统计模型,可将之看作一个数学上的双重随机过程:一个是用具有有限状态数的Markov链来模拟语音信号统计特性变化的隐含的随机过程,另一个是与Markov链的每一个状态相关联的观测序列的随机过程.前者通过后者表现出来,但前者的具体参数是不可测的.人的言语过程实际上就是一个双重随机过程,语音信号本身是一个可观测的时变序列,是由大脑根据语法知识和言语需要(不可观测的状态) 发出的音素的参数流.可见HMM合理地模仿了这一过程,很好地描述了语音信号的整体非平稳性和局部平稳性,是较为理想的一种语音模型.从整段语音来看,人类语音是一个非平稳的随机过程,但是若把整段语音分割成若干短时语音信号,则可认为这些短时语音信号是平稳过程,我们就可以用线性手段对这些短时语音信号进行分析.若对这些语音信号建立隐马尔可夫模型,则可以辩识具有不同参数的短时平稳的信号段,并可以跟踪它们之间的转化,从而解决了对语音的发音速率及声学变化建立模型的问题。
F. 如何用简单易懂的例子解释隐马尔可夫模型
和HMM模型相关的算法主要分为三类,分别解决三种问题:
1)知道骰子有几种(隐含状态数量),每种骰子是什么(转换概率),根据掷骰子掷出的结果(可见状态链),我想知道每次掷出来的都是哪种骰子(隐含状态链)。
这个问题呢,在语音识别领域呢,叫做解码问题。这个问题其实有两种解法,会给出两个不同的答案。每个答案都对,只不过这些答案的意义不一样。第一种解法求最大似然状态路径,说通俗点呢,就是我求一串骰子序列,这串骰子序列产生观测结果的概率最大。第二种解法呢,就不是求一组骰子序列了,而是求每次掷出的骰子分别是某种骰子的概率。比如说我看到结果后,我可以求得第一次掷骰子是D4的概率是0.5,D6的概率是0.3,D8的概率是0.2.第一种解法我会在下面说到,但是第二种解法我就不写在这里了,如果大家有兴趣,我们另开一个问题继续写吧。
2)还是知道骰子有几种(隐含状态数量),每种骰子是什么(转换概率),根据掷骰子掷出的结果(可见状态链),我想知道掷出这个结果的概率。
看似这个问题意义不大,因为你掷出来的结果很多时候都对应了一个比较大的概率。问这个问题的目的呢,其实是检测观察到的结果和已知的模型是否吻合。如果很多次结果都对应了比较小的概率,那么就说明我们已知的模型很有可能是错的,有人偷偷把我们的骰子给换了。
3)知道骰子有几种(隐含状态数量),不知道每种骰子是什么(转换概率),观测到很多次掷骰子的结果(可见状态链),我想反推出每种骰子是什么(转换概率)。
这个问题很重要,因为这是最常见的情况。很多时候我们只有可见结果,不知道HMM模型里的参数,我们需要从可见结果估计出这些参数,这是建模的一个必要步骤。
问题阐述完了,下面就开始说解法。(0号问题在上面没有提,只是作为解决上述问题的一个辅助)
G. 谁能帮我找一些关于马尔可夫模型的资料啊
摘 要:根据隐马尔可夫模型HMM的基本理论和算法设计了一个情感模型.该模型用E-HMM构成:子层(即低层)HMM由3个HMM组成,分别对应3种心理情绪状态.外部刺激经过子层初步识别,其输出组成高级层HMM的观察向量,经过高层HMM,确定情感输出,从而提高了模型的准确性.
关键词:隐马尔可夫模型;情感计算;情感模型
分类号:TP391.9 文献标识码:A
文章编号:1002-3186(2005)01-0061-04
作者简介:王玉洁,女,教授,主研方向为人工智能及机器人技术
作者单位:王玉洁(北京农学院基础科学系,北京,102206;北京科技大学信息工程学院,北京,100083)
王志良(北京科技大学信息工程学院,北京,100083)
陈锋军(北京科技大学信息工程学院,北京,100083)
王国江(北京科技大学信息工程学院,北京,100083)
王玉锋(北京科技大学信息工程学院,北京,100083)
参考文献:
[1]Picard R W. Affective computing[M]. MIT Press, London,England, 1997
[2]L R Rabiner. A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition. Proceedings of the IEEE, 1989,77(2) :257
[3]Chellappa R, Zhao W. Face Recognition: A Literature Survey. TO be submitted to ACM Journal of Computing Surveys, 2000
[4]Agazzi O,Kuo S. Hidden Markov Models Based Optical Character Recognition in Presence of Deterministic Transformation. Pattern Recognition, 1993,26 (12): 1813-1826
[5]Samaria F, Hatter A. Parameterisation of a Stochanastic Model for Human Face Identification. Sarasota, Florida: IEEE Workshop on Application of Computer Vision, 1994
[6]Nefian A V. A Hidden Markov Model-Based Approach for Face Detection and Recognition [PhD thesis]. school of Electrical and Computer Engineering, Georigia Institute of Technology, 1998
[7]Levin E, Pieraccini R. Dynamic Planar Warping for Optical Character Recognition. Proceeding of ICASSP92,1992, ( 3 ):149-152
[8]叶俊勇,汪同庆,彭健,杨波.基于伪二维隐马尔可夫模型的人脸识别.计算机工程,2003,(1):26-27
--------------------------------------------------------------------------------
题目 计算机系统入侵检测的隐马尔可夫模型
A Hidden Markov Model Used in Intrusion Detection
作者 谭小彬1 王卫平2 奚宏生1 殷保群1
TAN Xiao-Bin1, WANG Wei-Ping2, XI Hong-Sheng1, and YIN Bao-Qun1
单位 (中国科学技术大学自动化系 合肥 230027); 2(中国科学技术大学商学院 合肥 230026) ([email protected]
1(Department of Automation, University of Science & Technology of China, Hefei 230027) 2(School of Business and Management, University of Science & Technology of China, Hefei 230026)
关键词 入侵检测;异常检测;隐马尔可夫模型(HMM)
intrusion detection; anomaly detection; hidden Markov model (HMM)
摘要 入侵检测技术作为计算机安全技术的一个重要组成部分,现在受到越来越广泛地关注.首先建立了一个计算机系统运行状况的隐马尔可夫模型(HMM),然后在此模型的基础上提出了一个用于计算机系统实时异常检测的算法,以及该模型的训练算法.这个算法的优点是准确率高,算法简单,占用的存储空间很小,适合用于在计算机系统上进行实时检测.
As the key component of computer security technique, intrusion detection has received more and more attention. In this paper, an overview of research in anomaly detection is presented with emphasis on issues related to found a hidden Markov model (HMM) for the normal states of computer system, and an algorithm of anomaly detection is brought forward. The probability of observed sequence is computed and the average probability of a fixed length sequence is used as the metric of anomaly detection. To improve accuracy, an update algorithm for this hidden Markov model is also presented based on the forgetting factor. This method is not only useful in theory, but also can be used in practice to monitor the computer system in real time.
H. 请问关于隐马尔科夫的知识,尤其是viterbi算法的详细推导在什么书里能查到啊
《现代模式识别》,介绍的比较详细