python - 概率分布和浮点变量，概率必须加到1-6ren

python - 概率分布和浮点变量，概率必须加到1

转载作者：行者123 更新时间：2023-11-28 22:48:05

26

4

我正在编写这样一个脚本:该程序分析一堆特定语言的文本文档，绘制每个 k 的概率分布，其中 k 是出现在每个给定字母后的第一个字符在文本的每个单词中。然后程序使用这些知识尝试使用马尔可夫链写出“真实”的单词。

我已经写了大部分的脚本，它已经在吐出有趣的词了，关键是生成词的函数使用了 try and except 机制来避免卡住。它被卡住是因为一些概率分布不加到 1(我猜是因为 float 类型不是那么精确或类似的东西)并且应该与这些分布一起使用的 numpy 函数会引发 ValueError 因为概率不加起来为 1 .

通过触发某些分布的异常，一些词根本不会生成，最终结果不如它可能的那样有趣。

现在，我的问题是:有没有办法让这些概率分布在生成时加起来为1？我试过 gmpy2，round() 函数，但似乎没有人工作。也许这是一个愚蠢的问题，我只是需要呼吸一下新鲜空气...无论如何，一些帮助会很有用!

这里是生成概率分布的代码

def FreqRel(self,listValues):
    absFreq = self.AbsFreq(listValues)
    freqRel = []
    for i in absFreq:
        freqRel.append(i/sum(absFreq))
    if sum(freqRel) != 1:
        print("Frequencies do not add up to 1")
        if sum(freqRel) - 1 < 0:
            diff = sum(freqRel) - 1
            #This should be an adjustment which should not interfere
            #that much on the probability distribution
            freqRel[1] = freqRel[1] - diff
            print("missing",diff)
        elif sum(freqRel) - 1 > 0:
            diff = sum(freqRel) - 1
            #This should be an adjustment which should not interfere
            #that much on the probability distribution
            freqRel[1] = freqRel[1] - diff
            print("Too much",diff)
    return freqRel

这是我在运行此函数时在控制台上打印的内容: enter image description here

enter image description here

这是当总和不为 1 时崩溃的代码。numpy 行是那些崩溃的代码。错误是:ValueError: probabilities do not add up to 1.

def spitText(n):
    i = 0
    while i < n:
        try:
            word = ""
            #This oldChar setting is arbitrary, later I'm going to fix it
            oldChar = "b"
            for k in range(np.random.choice(distributions[0],replace=True,p=distributions[1])):
                newChar = np.random.choice(alphabet,replace=True,p=distRel[alphabet.index(oldChar)])
                word = word + newChar
                oldChar = newChar
            print(word)
            time.sleep(0.2)
            i+=1
        except:
            pass

最佳答案

你有一些看起来像这样的输出:

1.0
1.0
1.0
0
1.0
1.0

来自评论:

that's a simple for loop outside this function that prints out the sum of each distribution stored as a returned value from this function

因此，您的某些频率分布之和为 0。那是你的问题。

大概您构建分布的代码有一些边缘情况，要么返回一个空分布，要么返回一个全为零的分布。无论哪种方式，它显然都行不通。

事实上，许多 1.0 值因累积舍入误差高达 8e-17 而偏离，这是一个转移注意力的问题。您可以看到 numpy 是为处理这些问题而构建的:

>>> np.random.choice(2, 3, p=[0.4, 0.6+3e-17])
array([1, 0, 0])

只有当错误变得足够大时(大多数 numpy 的默认相对 epsilon 是 1e-5)它才会提示:

>>> np.random.choice(2, 3, p=[0.4, 0.6+3e-5])
ValueError: probabilities do not sum to 1

因此，您必须有一些概率分布，其总和与 1 相差超过 1e-5。你当然会；你有一些偏离了整个 1。

这意味着您的主要问题:

is there a way to make these probability distributions add up to 1 when they are generated?

…真的是一个XY problem : 这不是您需要在这里解决的问题。

不过我还是会回答的。简短的回答是:不。 float 是具有固定位数精度的二进制分数。如果您尝试将任意实数存储在 float 中，则会出现舍入错误。您可以很容易地看到这一点:

>>> 1.0 + 1e-17
1.0

只是没有足够的位来将 1.0 和 1.00000000000000001 存储为不同的二进制小数。

如果您想进一步了解(您应该)，请阅读 What every computer scientist should know about floating point ，有关该主题的经典介绍性论文。

关于python - 概率分布和浮点变量，概率必须加到1，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/25522931/

26

4

0

文章推荐： ios - UI 按钮图像粘贴 iOS 6

文章推荐： iphone - iOS - 如何读写这种格式的 plist

文章推荐： iphone - viewDidUnload 帮助 - iPhone 应用程序

文章推荐： ios - 触摸不通过 TextView

php - MySQL Join 加 Count 加 Sum
这是一个复杂的查询，我希望用一条语句实现它，而不是必须在 PHP 中处理数组值。要达到预期的输出: User Jobs Total John D. 5 $1245.67 Ma
php - 如何使用 CASE 加 JOIN 加 GROUP BY 到单个 MySQL 语句中
SELECT B. * , SC.cate_name, ( CASE WHEN special_offer_type = 'Fixed Value' THEN B.price - special_o
c# - Basic Booksleeve 加 Protobuf-net 加 Lists/SortedSets，实现？
关于将 booksleeve 与 protobuf-net 结合使用，我有一些相当基本的问题。现在我已经实现了一个单例类来管理连接，所以我多次重复使用与 recommended 相同的连接。 .现在我
Jquery 加/减增量器
我想要一个客户端加/减系统，用户可以单击加号，值会增加 1，减号，值会减少 1，该值永远不应该低于零，并且应该从 0 开始.有没有办法在 jquery 中简单地做到这一点？所有 jquery 插件都会
javascript - 加/减数量按钮的问题
我正在使用加号和减号按钮更新我的产品数量，这很有效，但我的问题是因为我在一个容器中有多个产品，它正在更新所有产品的数量。这是代码:
c++ - 加、减和比较压缩整数
我需要在大小相等的小整数数组上做大量简单的代数运算。这些操作仅包括三种:(i) 添加数组和 (ii) 按元素减去数组，以及 (iii) 比较一个数组中的所有元素是否不小于/大于另一个数组中的对应元素。
Javascript 加/减问题
我对 javascript 很陌生，但我需要一种 JS 方式来在单击按钮时增加/减少输入字段中的值。我已成功将值设置为显示 0，但当我单击“添加”按钮时，它不会增加。以下是 html 和 JS 代码
javascript - 加/减数字
我可以在输入字段中添加/减去一个数字。但是，我希望结果显示在中而不是在input中字段。我尝试使用innerHTML自己完成它但无法让它发挥作用。 $(function() { $('.min
jquery 加/减选择器
我的页面上有一个加号/减号 jquery 选择器。当页面加载或数字达到 1 时，我希望减号按钮变灰以模拟非事件状态。这是我的代码和 fiddle https://jsfiddle.net/pgxvhs
python - 加/减十六进制
我如何加/减用户输入的十六进制数？喜欢: basehex = input() sechex = input() sum = hex(basehex - sechex) print(sum) 我得到:
python简单实现矩阵的乘，加，转置和逆运算示例
本文实例讲述了python简单实现矩阵的乘，加，转置和逆运算。分享给大家供大家参考，具体如下：使用python完成矩阵的乘，加，转置和逆： ?
php - ±(加/减字符)转换为黑色问号
我输入的一些文本包括几个上下箭头(↑ 和 ↓)，以及一个加号/减号 (±)。这些特殊字符以 HTML ASCII 输入:↑ ↓ ±。在 POST 上，HTML 在保存到 MySQL 表之前使用 ht
delphi - 直接显示捕获引脚配置运行时实时游戏玩家可移植 2 加
我正在尝试配置 Live Gamer Portable 2 Plus 的输出引脚以降低帧速率。通过 GraphStudioNext，我可以通过捕获引脚访问配置并更改帧速率。但是，当我通过 API 在
windows - 如何在两个日期和时间时间戳之间执行算术运算(加，减)？
我正在尝试使用批处理文件创建任意时间。我试图从我的代码中减去设置值(例如1天，1个月和2000年)，以显示系统时间减去前面所述的设置值。对于小时和分钟，我要减去10小时和10分钟(在代码中显示为不同的
c - ATmega8 加/减计数器计数不正确
我想建立一个 5 位向上/向下计数器。当我能让模拟工作时，我会更乐意购买零碎的东西来构建它。到目前为止，我使用的是 ATmega8，但坦率地说，只要组件相当便宜，任何解决方案都适合我。我在网上找到了
javascript - AngularJS 加/减切换
使用 ng-repeat 时在数字输入字段上添加加/减切换的最佳方法是什么我这样试过，但没用: - + vm.plus = f
MySQL:UNION 加 JOIN
我正在尝试弄清楚如何将 UNION 与相同的 JOIN 一起使用，而不是陷入 #2014 - 命令不同步。我创建了四个简单的表格并为它们编写了简化的代码。主要想法是获得名字中带有“最佳”字样的每把剑
javascript - js中的数学运算(加/减)
这个问题已经有答案了: Is floating point math broken? (33 个回答) 已关闭 9 年前。我有一个简单的函数，应该生成 1000 个不同的元素: var start
html - 在一个类中使用多个 +(加)运算符是否合法？
我目前正在编写一个响应式设计，我正处于移动导航折叠的地步。为此，我创建了两个 div 和一个 ul。 ul 包含我的 nav 元素，而 div 将显示移动设备和平板电脑下拉菜单的导航图像。 HTML
javascript - Woocommerce 加/减数量按钮更改值但实际上不起作用
我为 woocommerce 单个产品页面创建了一个加/减数量按钮。创建了一个新的数量-input.php " min="" max="" name="" value="" ti

首页

博学

6Ren·AI

商城

python - 概率分布和浮点变量，概率必须加到1