machine-learning - 马尔可夫链 - 具有 "unseen"个观测值的样本的可能性(概率 0)-6ren

machine-learning - 马尔可夫链 - 具有 "unseen"个观测值的样本的可能性(概率 0)

转载作者：行者123 更新时间：2023-11-30 09:37:43

24

4

我有一个大的马尔可夫链和一个样本，我想计算其可能性。问题是样本中的某些观察或转换不会发生在马尔可夫链中，这使得总似然为 0(或对数似然 - 无穷大)。不可能使用更多的数据来构建马尔可夫链。我想知道是否有办法仍然具有有意义的可能性。

我已经尝试过滤掉样本中的这些“未知”观察结果并单独报告它们。但问题是我想将样本的可能性与同一样本的可能性进行比较，但经过转换。转换后的样本具有不同数量的“未知”观察值。因此，我认为我无法比较这两种可能性，因为它们是通过不同数量的观察结果计算出来的。

有没有办法仍然计算可以比较的有意义的可能性？我正在考虑对样本中观察到的概率进行平均，但我找不到任何正确的信息。

提前致谢!

最佳答案

简单来说 - 概率模型中的关键是概率分布估计器。看来您使用了最简单的可能 - 经验估计器，其形式为

p(event) = count(event) / [count(event) + count(not-event)]

对于未见过的事件估计概率为 0，这会导致明显的问题。有数十种估计器不存在此问题，最简单的估计器之一是拉普拉斯平滑，其中您假设对未见过的事件存在一定的概率限制

p(event) = [count(event) + alpha] / [count(event) + count(not-event) + alpha * #event-types]

这样，即使没有发生的事件也具有非零概率。

关于machine-learning - 马尔可夫链 - 具有 "unseen"个观测值的样本的可能性(概率 0)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/32008010/

24

4

0

文章推荐： java - 在没有 Spark 控制台的情况下使用 Apache Spark MLib 库

文章推荐： javascript - 使相同的按钮播放/暂停 html5 视频

文章推荐： regex - 从文档中提取信息，训练集不多

文章推荐： javascript - JavaScript 和 ActionScript 中 "this"的区别

api - 是否可以用 'unseen=0' 标记消息线程？
我致力于 Facebook 的 Google Chrome 扩展程序。我有一个按钮，如果您单击它，则会出现一个包含最新事件线程的弹出窗口。我想对 facebook 服务器说，之后没有任何线程是“看不
css - 在 CSS #unseen 样式方面需要帮助
我只喜欢在第一个 tr 中看到 th 但在第二个 tr 中的 th 消失了.您知道如何修复代码，使第一个 th 包含“Min.”吗？媒体宽度小于640px时可以显示文字吗？先感谢您!
PHP imap_search UNSEEN SINCE 日期与时间
我正在使用 PHP imap_search 来获取自给定日期以来未看到的消息列表，如下所示: imap_search($stream, 'UNSEEN SINCE 20-Sep-2015'); 这工作
ios - Sprite Kit 是否会释放 Unseen Sprites
在我的 Sprite Kit 应用程序中，在执行达到某个点后，我遇到了突然的延迟峰值。我相信我已经将问题范围缩小到我的 SKScene 子类中的以下片段。 - (void)touchesMoved:(
mysql - 优化 mysql 查询以获取每个用户 "unseen"个条目
这个标题相当令人着迷，但我想不出更清晰的东西。长话短说，我们正在创建一个连接到与 mySql 数据库通信的 node.js 服务器的移动应用程序。很常见的设置。现在，我们连接了多个用户，可以将“时刻
python - Fastai 文本分类器 : batch prediction on unseen data
我一直在使用 fastai 的文本分类器 (https://docs.fast.ai/text.html)。我目前预测看不见的短语的情绪(正面或负面)如下: def _unpack_predictio
ruby-on-rails - Rails 用户 'unseen pages' 计数器
我有一个使用 devise 进行身份验证的简单 Rails 应用程序。我有兴趣为每个访问特定页面时更新的用户创建一个计数器。例如: 用户计数器 = 4 用户访问页面A用户计数器 = 3 用户再次访问
apache-spark - spark.ml StringIndexer在fit()上抛出 'Unseen label'
我正在准备一个玩具spark.ml示例。 Spark version 1.6.0，在Oracle JDK version 1.8.0_65，pyspark和ipython笔记本上运行。首先，它与Sp
php - PHP 中的 IMAP : Marking a message unread/unseen
我想在 php 中创建一个脚本来读取来自邮件帐户的所有邮件。我连接到服务器，我可以看到邮件，但是我想把它恢复到看不见的状态，我找不到执行此操作的功能。最佳答案如果我正确理解此页面: http://
machine-learning - 马尔可夫链 - 具有 "unseen"个观测值的样本的可能性(概率 0)
我有一个大的马尔可夫链和一个样本，我想计算其可能性。问题是样本中的某些观察或转换不会发生在马尔可夫链中，这使得总似然为 0(或对数似然 - 无穷大)。不可能使用更多的数据来构建马尔可夫链。我想知道是否
python - org.apache.spark.SparkException : Unseen label with TrainValidationSplit
我正在搜索此错误，但没有找到与 TrainValidationSplit 相关的任何内容。所以我想进行参数调整，并使用 TrainValidationSplit 执行此操作会出现以下错误:org.ap
mysql - Doctrine2 选择所有 "unseen"行和/或最多 10 行
我面临着这样的情况:我有一个通知/消息表。我想做的是获取: 最多 10 条消息所有未读消息有一个限制，如果有超过 10 条未读消息，我们只获取这些消息。所以基本上我希望最后有 10 条消息(未读和
sockets - Wireshark 中的 [TCP ACKed unseen segment] 等是什么？
我已经通过 SCP 传输数据并在上图中得到一些消息(黑色)。这些消息有什么关系(TCP ACKed...，TCP Zerowindow 和 TCP Prev...)。非常感谢您，对于网络新手的语言感到
python - 值错误 : y contains previously unseen labels: 'A' using OrdinalEncoder
label_encode_dict['cat116'] # output OrdinalEncoder(handle_unknown='use_encoded_value', unknown_valu
tcp - 理解 [TCP ACKed unseen segment] [TCP Previous segment not captured]
我们正在我们的服务器上进行一些负载测试，我正在使用 tshark 将一些数据捕获到 pcap 文件，然后使用 wireshark GUI 通过转到 Analyze -> expert Info 来查看
apache-spark - Spark 2.1.1 : How to predict topics in unseen documents on already trained LDA model in Spark 2. 1.1？
我正在 pyspark (spark 2.1.1) 中根据客户评论数据集训练 LDA 模型。现在，基于该模型，我想预测新的看不见的文本中的主题。我使用以下代码来制作模型 from pyspark i

首页

博学

6Ren·AI

商城

machine-learning - 马尔可夫链 - 具有 "unseen"个观测值的样本的可能性(概率 0)