gpt4 book ai didi

java - 计算字符串的概率

转载 作者:太空宇宙 更新时间:2023-11-04 07:30:31 25 4
gpt4 key购买 nike

我想计算字符串中字符出现的概率。例如,给定一个字符串“test”,我想得到 P(test)。

P(test) = p(t) * p(e|t) * p (s|te) * p(t|es)

我计算了超过100k个字符串的各种二元词频率,并计算了它们出现的概率。我的问题是,仅通过乘以字符串中 n-gram 的概率我就能得到准确的答案,还是有更好的方法来找到相同的答案?

非常感谢任何帮助。

最佳答案

使用二元语法,您的答案将与 second-order Markov chain 一样准确。 。对于这样一个简单的模型来说,结果出人意料地好,但是当然,您可以使用更具表现力的模型做得更好。例如,在语言建模中,Hidden Markov Models (HMMs)经常被使用。

关于java - 计算字符串的概率,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17785014/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com