马尔可夫链和隐马尔可夫模型有什么区别?

goo*_*ing 44 markov-chains markov hidden-markov-models

马尔可夫链模型和隐马尔可夫模型有什么区别?我在维基百科上读过,但无法理解这些差异.

mat*_*att 38

为了通过示例解释,我将使用自然语言处理的示例.想象一下,你想知道这句话的概率:

我喜欢咖啡

在马尔可夫模型中,您可以通过计算来估计其概率:

P(WORD = I) x P(WORD = enjoy | PREVIOUS_WORD = I) x P(word = coffee| PREVIOUS_WORD = enjoy)
Run Code Online (Sandbox Code Playgroud)

现在,想象一下我们想知道这句话的词性标签,也就是说,如果一个单词是过去时动词,名词等.

我们没有在该句中观察到任何词性标签,但我们假设它们在那里.因此,我们计算词性标签序列的概率是多少.在我们的例子中,实际的顺序是:

PRP-VBP-NN

(其中PRP ="人称代词",VBP ="动词,非第三人称单数礼物",NN ="名词,单数或质量".请参阅https://cs.nyu.edu/grishman/jet/guide/PennPOS .html用于Penn POS标记的完整表示法)

可是等等!这是我们可以应用马尔可夫模型的序列.但我们称之为隐藏,因为从不直接观察到词性序列.当然,在实践中,我们将计算许多这样的序列,我们希望找到最能解释我们观察的隐藏序列(例如,我们更可能看到由确定器生成的诸如'the','this'之类的单词( DET)标签)

我遇到过的最好的解释是劳伦斯·R·拉宾(Lawrence R. Rabiner)1989年发表的一篇论文:http://www.cs.ubc.ca/~murphyk/Bayes/rabiner.pdf


小智 26

马尔可夫模型是状态机,状态变化是概率.在隐马尔可夫模型中,您不知道概率,但您知道结果.

例如,当您掷硬币时,您可以获得概率,但是,如果您无法看到翻转并且有人在每个硬币翻转时移动五个手指中的一个,您可以采取手指移动并使用隐藏的马尔可夫模型来获得硬币翻转的最佳猜测.


Car*_*tes 11

据我了解,问题是:马尔可夫过程和隐马尔可夫过程之间有什么区别?

马尔可夫过程(MP)是具有以下条件的随机过程:

  1. 有限状态数
  2. 这些状态之间的概率转换
  3. 下一个状态仅由当前状态决定(Markov属性)

隐马尔可夫过程(HMM)也是具有以下特征的随机过程:

  1. 有限状态数
  2. 这些状态之间的概率转换
  3. 下一个状态仅由当前状态(Markov属性)决定,并且
  4. 我们不确定我们处于哪个状态:当前状态发出观察值。

示例-(HMM)股票市场
在股票市场中,人们以公司的价值进行交易。假设该股票的实际价值为100美元(这是不可观察的,实际上您永远都不知道)。然后,您真正看到的是与之交易的价值:在这种情况下,我们假设为90美元(这是可观察的)。

对于对Markov感兴趣的人:有趣的部分是当您开始对这些模型进行操作(在前面的示例中,是为了赚钱)。这涉及马尔可夫决策过程(MDP)和部分可观察的马尔可夫决策过程(POMDP)。为了评估这些模型的一般分类,我在下图中总结了每个马尔可夫模型的主要特征。

不同马尔可夫模型的分类


Aer*_*rin 7

由于Matt使用词性标签作为HMM示例,因此我可以再添加一个示例:语音识别。几乎所有大型词汇连续语音识别(LVCSR)系统都基于HMM。

“马特的例子”: 我喜欢喝咖啡

在马尔可夫模型中,您可以通过以下方式估算其概率:

P(WORD = I) x P(WORD = enjoy | PREVIOUS_WORD = I) x P(word = coffee| PREVIOUS_WORD = enjoy)
Run Code Online (Sandbox Code Playgroud)

在隐马尔可夫模型中

假设有30个不同的人读了“我喜欢拥抱”一词,我们必须认出它来。每个人的句子发音都不一样。因此,我们不知道该人是指“拥抱”还是“拥抱”。我们只会得到实际单词的概率分布。

简而言之,隐马尔可夫模型是统计马尔可夫模型,其中将要建模的系统假定为具有未观察(隐藏)状态的马尔可夫过程。