python - 编写集成高斯函数的 Python 函数的最佳方法？-6ren

python - 编写集成高斯函数的 Python 函数的最佳方法？

转载作者：太空狗更新时间：2023-10-29 22:00:06

28

4

在尝试使用 scipy 的 quad 方法对高斯积分(假设有一种名为 gauss 的高斯方法)时，我在将所需参数传递给高斯并让 quad 对正确变量进行积分时遇到了问题。有没有人有一个很好的例子来说明如何使用带有多维函数的四边形？

但这让我想到了一个更宏大的问题，即整合高斯的最佳方法。我没有在 scipy 中找到高斯积分(令我惊讶)。我的计划是编写一个简单的高斯函数并将其传递给 quad(或者现在可能是一个固定宽度的积分器)。你会怎么办？

编辑:固定宽度的意思是像 trapz 一样使用固定的 dx 来计算曲线下的面积。

到目前为止，我想到的是一个方法 make___gauss，它返回一个 lambda 函数，然后可以进入 quad。通过这种方式，我可以在积分之前使用我需要的平均值和方差制作一个正常函数。

def make_gauss(N, sigma, mu):
    return (lambda x: N/(sigma * (2*numpy.pi)**.5) *
            numpy.e ** (-(x-mu)**2/(2 * sigma**2)))

quad(make_gauss(N=10, sigma=2, mu=0), -inf, inf)

当我尝试传递一个通用的高斯函数(需要用 x、N、mu 和 sigma 调用)并使用 quad 填充一些值时

quad(gen_gauss, -inf, inf, (10,2,0))

参数 10、2 和 0 不一定匹配 N=10、sigma=2、mu=0，这提示了更扩展的定义。

scipy.special 中的 erf(z) 需要我准确定义 t 最初是什么，但很高兴知道它在那里。

最佳答案

好吧，你似乎对几件事很困惑。让我们从头开始:您提到了“多维函数”，然后继续讨论通常的单变量高斯曲线。这不是一个多维函数:当你对它进行积分时，你只对一个变量 (x) 进行积分。区别很重要，因为有一个叫做“多元高斯分布”的怪物，它是一个真正的多维函数，如果集成，需要对两个或多个变量进行积分(使用我之前提到的昂贵的蒙特卡罗技术)。但是您似乎只是在谈论常规的单变量高斯，它更容易使用、集成等等。

一变量高斯分布有两个参数，sigma和 mu ，并且是单个变量的函数，我们将表示为 x .您似乎还携带了标准化参数 n (这在一些应用程序中很有用)。归一化参数通常不包含在计算中，因为您可以在最后重新添加它们(请记住，积分是一个线性运算符:int(n*f(x), x) = n*int(f(x), x))。但如果您愿意，我们可以随身携带；我喜欢的正态分布符号是
N(x | mu, sigma, n) := (n/(sigma*sqrt(2*pi))) * exp((-(x-mu)^2)/(2*sigma^2))
(读作“给定 x、sigma 和 mu 的正态分布 n 由...给出”)到目前为止，很好；这与您拥有的功能相匹配。请注意，这里唯一真正的变量是 x :其他三个参数对于任何特定的高斯都是固定的。

现在来看一个数学事实:可以证明，所有高斯曲线都具有相同的形状，只是稍微移动了一点。所以我们可以使用 N(x|0,1,1) ，称为“标准正态分布”，只是将我们的结果转换回一般的高斯曲线。所以如果你有 N(x|0,1,1) 的积分，您可以轻松计算任何高斯的积分。这个积分出现得如此频繁以至于它有一个特殊的名字:误差函数erf .由于一些旧约定，它不完全是 erf ;还有一些加法和乘法因素也被随身携带。

如 Phi(z) = integral(N(x|0,1,1), -inf, z) ;也就是说，Phi(z)是从负无穷大到 z 的标准正态分布的积分，那么根据误差函数的定义是正确的
Phi(z) = 0.5 + 0.5 * erf(z / sqrt(2)) .

同样，如果 Phi(z | mu, sigma, n) = integral( N(x|sigma, mu, n), -inf, z) ;也就是说，Phi(z | mu, sigma, n)是给定参数的正态分布的积分 mu , sigma , 和 n从负无穷大到 z ，那么根据误差函数的定义是正确的
Phi(z | mu, sigma, n) = (n/2) * (1 + erf((x - mu) / (sigma * sqrt(2)))) .

看看the Wikipedia article on the normal CDF如果你想要更多细节或这个事实的证明。

好的，这应该是足够的背景解释。回到你的(编辑过的)帖子。你说“scipy.special 中的 erf(z) 需要我准确定义 t 最初是什么”。我不知道你的意思是什么；在哪里t (时间？)进入这个？希望上面的解释使错误函数变得神秘一点，现在更清楚为什么错误函数是工作的正确函数。

你的 Python 代码没问题，但我更喜欢闭包而不是 lambda:

def make_gauss(N, sigma, mu):
    k = N / (sigma * math.sqrt(2*math.pi))
    s = -1.0 / (2 * sigma * sigma)
    def f(x):
        return k * math.exp(s * (x - mu)*(x - mu))
    return f

使用闭包可以预先计算常量 k和 s ，因此每次调用返回的函数时都需要做更少的工作(如果您正在集成它，这可能很重要，这意味着它将被多次调用)。此外，我避免使用任何取幂运算符 ** ，这比写出平方要慢，并且将除法从内循环中取出并用乘法代替。我完全没有研究过它们在 Python 中的实现，但是从我上次使用原始 x87 程序集调整内部循环以获得纯速度时，我似乎记得加法、减法或乘法每个需要大约 4 个 CPU 周期，除以大约36 和大约 200 的幂。那是几年前的事了，所以对这些数字持保留态度；尽管如此，它还是说明了它们的相对复杂性。同样，计算 exp(x)蛮力方式是一个非常糟糕的主意；在编写 exp(x) 的良好实现时，您可以采取一些技巧。这使它比一般的 a**b 更快、更准确样式求幂。

我从未使用过常量 pi 和 e 的 numpy 版本；我一直坚持使用普通的旧数学模块版本。我不知道为什么你可能更喜欢任何一个。

我不确定您要使用 quad() 做什么称呼。 quad(gen_gauss, -inf, inf, (10,2,0))应该将重归一化的高斯从负无穷大积分到正无穷大，并且应该始终吐出 10(您的归一化因子)，因为高斯在实线上积分为 1。任何远离 10 的答案(我不希望正好是 10，因为 quad() 毕竟只是一个近似值)意味着某些地方出了问题......工作原理 quad() .

希望这已经揭开了一些困惑的神秘面纱，并解释了为什么错误函数是您问题的正确答案，以及如果您很好奇，如何自己做这一切。如果我的任何解释不清楚，我建议先快速浏览一下维基百科；如果您仍有疑问，请随时提出。

关于python - 编写集成高斯函数的 Python 函数的最佳方法？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/509994/

28

4

0

文章推荐： c# - UWP ComboBox 不再具有打开/关闭动画(内部版本 14393)

文章推荐： python - 调用未知的 Python 函数

文章推荐： c# - Visual Studio 智能感知列表为空

文章推荐： python - 使用 Python 反向补充 DNA 链

php - 价格低-高/高-低过滤 PHP/Mysql
我正在寻找一种方法来创建根据价格选择我的产品的过滤器(选择下拉菜单)。我知道这样的查询是完全可能的: SELECT * FROM products ORDER BY price ASC SELECT
language-agnostic - 是(宽，高)还是(高，宽)？
函数参数中或显示尺寸时(高度，宽度)的顺序是否有约定？最佳答案我不知道大量的语言，但我使用过的语言(宽度，高度)。它更适合沿着 (x, y) 坐标线。关于language-agnostic -
javascript - 如果是计算形式，则计算立方米=高*平方米或立方米=长*宽*高
在我的表单中，我让用户输入房间的长度高度和宽度以获得 m2、m3 和瓦特的计算值。但是用户也应该能够直接输入 height 和 m2 来获取值。我尝试了很多语法，但 if else 不能正常工作。我知
elasticsearch - 创建索引的未知键 [高]
我在 Elasticsearch 中创建了一个索引，看起来像 {"amazingdocs":{"aliases":{},"mappings":{"properties":{"Adj Close":{"
快速将多个图像一次保存到文件系统，CPU 高
我有以下功能，我需要清除数据库中的所有图片列并移动到文件系统。当我一次性完成这一切时，内存太多并且会崩溃。我切换到递归函数并执行 20 次写入和批量操作。我需要为大约 6 个表执行此操作。我的 Re
C# 高 double
我正在编写一个函数来计算 PI 的值，并将其作为 double 值返回。到目前为止，一切都很好。但是一旦函数到达小数点后14位，它就不能再保存了。我假设这是因为 double 有限。我应该怎么做才能继
与传统cdn相比高性能cdn “高”在哪里?
2020年是中国CDN行业从98年诞生到今天快速发展的第二十四年，相关数据显示，全国感知网速持续上扬，达到了3.29兆/秒，标志着在宽带中国的政策指导下，中国的网速水平正在大步赶上世界发达国家的水平
lua - 高 Aerospike 延迟
在 aerospike 集合中，我们有四个 bin userId、adId、timestamp、eventype，主键是 userId:timestamp。在 userId 上创建二级索引以获取特定用
onclick - 高 map 获取点击事件的国家名称
$('#container').highcharts('Map', { title : { text : 'Highmaps basic demo'
youtube - YouTube嵌入广告的视频尺寸更大(宽/高)
有没有办法显示自定义宽度/高度的YouTube视频？最佳答案在YouTube网站上的this link中: You can resize the player by editing the obj
javascript - 高 map 中的动态悬停颜色
我使用 Highcharts ，我想在 Highcharts 状态下悬停时制作动态不同的颜色。正如你可以看到不同的颜色，这就是我做的 var usMapChart , data = [] ; va
cassandra - 高 native 传输请求始终被阻止
在所有节点上运行 tpstats 后。我看到很多节点都有大量的 ALL TIME BLOCKED NTR。我们有一个 4 节点集群，NTR ALL TIME BLOCKED 的值为: 节点 1:239
apc - 高 APC 碎片重要吗？
我发现 APC 上存在大量碎片 (>80%)，但实际上性能似乎相当不错。我有 read another post这建议在 wordpress/w3tc 中禁用对象缓存，但我想知道减少碎片是否比首先缓存
python - 高/低游戏 : ValueError
对于我的脚本类(class)，我们必须制作更高/更低的游戏。到目前为止，这是我的代码: import random seedVal = int(input("What seed should be u
apc - 高 APC 碎片重要吗？
我发现 APC 上存在大量碎片 (>80%)，但实际上性能似乎相当不错。我有 read another post这建议在 wordpress/w3tc 中禁用对象缓存，但我想知道减少碎片是否比首先缓存
python - 高/低游戏 : ValueError
对于我的脚本类(class)，我们必须制作更高/更低的游戏。到目前为止，这是我的代码: import random seedVal = int(input("What seed should be u
unicode - 高 unicode 代码点如何表示为两个代码点？
我已经 seen >2 字节的 unicode 代码点，如 U+10000 可以成对编写，如 \uD800\uDC00。它们似乎以半字节 d 开头，但我只注意到了这一点。这个 split Actio
javascript - 高(饼)图计算不正确
有人可以帮我理解为什么我的饼图百分比计算不正确吗？看截图: 根据我的计算，如 RHS 上所示，支出百分比应为 24.73%。传递给 Highcharts 的值如下:- 花费:204827099.36-
Mysql 高 CPU 使用率甚至优化配置
我阅读了有关该问题的所有答案，但我还没有找到任何解决方案。我有一个应用程序，由我的 api 服务器提供。 Wildfly 8.1 和 Mysql 5.6。当查看时间到来时(Wildfly 服务器连接
javascript - 高 Angular 圆圈周围的元素
我正在用选定的项目创建圆形导航。当用户单击任何项目时，它将移动到定义的特定点。一切都很好，除了当你继续点击项目时，当动画表现不同并且项目在 360 度圆中移动并且它被重置直到你重复场景时，我希望它

首页

博学

6Ren·AI

商城

python - 编写集成高斯函数的 Python 函数的最佳方法？