- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在编写这样一个脚本:该程序分析一堆特定语言的文本文档,绘制每个 k 的概率分布,其中 k 是出现在每个给定字母后的第一个字符在文本的每个单词中。然后程序使用这些知识尝试使用马尔可夫链写出“真实”的单词。
我已经写了大部分的脚本,它已经在吐出有趣的词了,关键是生成词的函数使用了 try and except 机制来避免卡住。它被卡住是因为一些概率分布不加到 1(我猜是因为 float 类型不是那么精确或类似的东西)并且应该与这些分布一起使用的 numpy 函数会引发 ValueError 因为概率不加起来为 1 .
通过触发某些分布的异常,一些词根本不会生成,最终结果不如它可能的那样有趣。
现在,我的问题是:有没有办法让这些概率分布在生成时加起来为1?我试过 gmpy2,round() 函数,但似乎没有人工作。也许这是一个愚蠢的问题,我只是需要呼吸一下新鲜空气...无论如何,一些帮助会很有用!
这里是生成概率分布的代码
def FreqRel(self,listValues):
absFreq = self.AbsFreq(listValues)
freqRel = []
for i in absFreq:
freqRel.append(i/sum(absFreq))
if sum(freqRel) != 1:
print("Frequencies do not add up to 1")
if sum(freqRel) - 1 < 0:
diff = sum(freqRel) - 1
#This should be an adjustment which should not interfere
#that much on the probability distribution
freqRel[1] = freqRel[1] - diff
print("missing",diff)
elif sum(freqRel) - 1 > 0:
diff = sum(freqRel) - 1
#This should be an adjustment which should not interfere
#that much on the probability distribution
freqRel[1] = freqRel[1] - diff
print("Too much",diff)
return freqRel
这是我在运行此函数时在控制台上打印的内容:
这是当总和不为 1 时崩溃的代码。numpy 行是那些崩溃的代码。错误是:ValueError: probabilities do not add up to 1.
def spitText(n):
i = 0
while i < n:
try:
word = ""
#This oldChar setting is arbitrary, later I'm going to fix it
oldChar = "b"
for k in range(np.random.choice(distributions[0],replace=True,p=distributions[1])):
newChar = np.random.choice(alphabet,replace=True,p=distRel[alphabet.index(oldChar)])
word = word + newChar
oldChar = newChar
print(word)
time.sleep(0.2)
i+=1
except:
pass
最佳答案
你有一些看起来像这样的输出:
1.0
1.0
1.0
0
1.0
1.0
来自评论:
that's a simple for loop outside this function that prints out the sum of each distribution stored as a returned value from this function
因此,您的某些频率分布之和为 0
。那是你的问题。
大概您构建分布的代码有一些边缘情况,要么返回一个空分布,要么返回一个全为零的分布。无论哪种方式,它显然都行不通。
事实上,许多 1.0
值因累积舍入误差高达 8e-17 而偏离,这是一个转移注意力的问题。您可以看到 numpy 是为处理这些问题而构建的:
>>> np.random.choice(2, 3, p=[0.4, 0.6+3e-17])
array([1, 0, 0])
只有当错误变得足够大时(大多数 numpy 的默认相对 epsilon 是 1e-5)它才会提示:
>>> np.random.choice(2, 3, p=[0.4, 0.6+3e-5])
ValueError: probabilities do not sum to 1
因此,您必须有一些概率分布,其总和与 1
相差超过 1e-5
。你当然会;你有一些偏离了整个 1
。
这意味着您的主要问题:
is there a way to make these probability distributions add up to 1 when they are generated?
…真的是一个XY problem : 这不是您需要在这里解决的问题。
不过我还是会回答的。简短的回答是:不。 float 是具有固定位数精度的二进制分数。如果您尝试将任意实数存储在 float 中,则会出现舍入错误。您可以很容易地看到这一点:
>>> 1.0 + 1e-17
1.0
只是没有足够的位来将 1.0
和 1.00000000000000001
存储为不同的二进制小数。
如果您想进一步了解(您应该),请阅读 What every computer scientist should know about floating point ,有关该主题的经典介绍性论文。
关于python - 概率分布和浮点变量,概率必须加到1,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25522931/
这是一个复杂的查询,我希望用一条语句实现它,而不是必须在 PHP 中处理数组值。 要达到预期的输出: User Jobs Total John D. 5 $1245.67 Ma
SELECT B. * , SC.cate_name, ( CASE WHEN special_offer_type = 'Fixed Value' THEN B.price - special_o
关于将 booksleeve 与 protobuf-net 结合使用,我有一些相当基本的问题。现在我已经实现了一个单例类来管理连接,所以我多次重复使用与 recommended 相同的连接。 .现在我
我想要一个客户端加/减系统,用户可以单击加号,值会增加 1,减号,值会减少 1,该值永远不应该低于零,并且应该从 0 开始.有没有办法在 jquery 中简单地做到这一点?所有 jquery 插件都会
我正在使用加号和减号按钮更新我的产品数量,这很有效,但我的问题是因为我在一个容器中有多个产品,它正在更新所有产品的数量。这是代码:
我需要在大小相等的小整数数组上做大量简单的代数运算。这些操作仅包括三种:(i) 添加数组和 (ii) 按元素减去数组,以及 (iii) 比较一个数组中的所有元素是否不小于/大于另一个数组中的对应元素。
我对 javascript 很陌生,但我需要一种 JS 方式来在单击按钮时增加/减少输入字段中的值。我已成功将值设置为显示 0,但当我单击“添加”按钮时,它不会增加。 以下是 html 和 JS 代码
我可以在输入字段中添加/减去一个数字。 但是,我希望结果显示在中而不是在input中字段。 我尝试使用innerHTML自己完成它但无法让它发挥作用。 $(function() { $('.min
我的页面上有一个加号/减号 jquery 选择器。当页面加载或数字达到 1 时,我希望减号按钮变灰以模拟非事件状态。这是我的代码和 fiddle https://jsfiddle.net/pgxvhs
我如何加/减用户输入的十六进制数? 喜欢: basehex = input() sechex = input() sum = hex(basehex - sechex) print(sum) 我得到:
本文实例讲述了python简单实现矩阵的乘,加,转置和逆运算。分享给大家供大家参考,具体如下: 使用python完成矩阵的乘,加,转置和逆: ?
我输入的一些文本包括几个上下箭头(↑ 和 ↓),以及一个加号/减号 (±)。 这些特殊字符以 HTML ASCII 输入:↑ ↓ ±。在 POST 上,HTML 在保存到 MySQL 表之前使用 ht
我正在尝试配置 Live Gamer Portable 2 Plus 的输出引脚以降低帧速率。通过 GraphStudioNext,我可以通过捕获引脚访问配置并更改帧速率。 但是,当我通过 API 在
我正在尝试使用批处理文件创建任意时间。我试图从我的代码中减去设置值(例如1天,1个月和2000年),以显示系统时间减去前面所述的设置值。对于小时和分钟,我要减去10小时和10分钟(在代码中显示为不同的
我想建立一个 5 位向上/向下计数器。当我能让模拟工作时,我会更乐意购买零碎的东西来构建它。到目前为止,我使用的是 ATmega8,但坦率地说,只要组件相当便宜,任何解决方案都适合我。 我在网上找到了
使用 ng-repeat 时在数字输入字段上添加加/减切换的最佳方法是什么 我这样试过,但没用: - + vm.plus = f
我正在尝试弄清楚如何将 UNION 与相同的 JOIN 一起使用,而不是陷入 #2014 - 命令不同步。 我创建了四个简单的表格并为它们编写了简化的代码。主要想法是获得名字中带有“最佳”字样的每把剑
这个问题已经有答案了: Is floating point math broken? (33 个回答) 已关闭 9 年前。 我有一个简单的函数,应该生成 1000 个不同的元素: var start
我目前正在编写一个响应式设计,我正处于移动导航折叠的地步。 为此,我创建了两个 div 和一个 ul。 ul 包含我的 nav 元素,而 div 将显示移动设备和平板电脑下拉菜单的导航图像。 HTML
我为 woocommerce 单个产品页面创建了一个加/减数量按钮。创建了一个新的数量-input.php " min="" max="" name="" value="" ti
我是一名优秀的程序员,十分优秀!