gpt4 book ai didi

nlp - 在实现用于词性标注的维特比算法时,HMM 中的开始和结束状态是否必要?

转载 作者:行者123 更新时间:2023-12-03 23:17:44 27 4
gpt4 key购买 nike

我不完全理解如何使用隐马尔可夫模型中的开始和结束状态。为了设计和实现过渡和排放矩阵,这些是必要的吗?

最佳答案

开始/结束状态对于建模标签是否可能出现在句子的开头或结尾是必要的。

例如,如果您有一个五个字的句子,并且您正在考虑使用两个标签

  • Det 名词动词 Det 名词
  • Det 名词动词 Det Adj

  • 这两个在转换方面看起来都不错,因为 Det->Noun 和 Det->Adj 都很有可能。但是,以 Adj 结尾的句子比以名词结尾要少得多,如果没有结束标签,你就不会得到这种东西。所以你真正想要比较的是
  • START Det 名词动词 Det 名词END
  • START Det 名词动词 Det Adj END

  • 然后你将计算 P(END|Noun) 和 P(END|Adj)。

    如果您正在进行监督训练,那么使用 START/END 获取概率与其他标签没有什么不同,您只需在计算之前将特殊标签附加到每个句子。因此,如果您的训练语料库具有:
    Det Noun Verb
    Det Noun Verb Det Noun

    然后你将它修改为
    START Det Noun Verb END
    START Det Noun Verb Det Noun END

    并计算,例如:
  • P(Det|START) = 2/2
  • P(END|动词) = 1/2
  • P(END|名词) = 1/3

  • 此外,排放是微不足道的:P(START|START)=1 和 P(END|END)=1

    关于nlp - 在实现用于词性标注的维特比算法时,HMM 中的开始和结束状态是否必要?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21800325/

    27 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com