python - 使用 Monte Carlo 与 scipy.integrate.nquad 的不同积分结果-6ren

python - 使用 Monte Carlo 与 scipy.integrate.nquad 的不同积分结果

转载作者：行者123 更新时间：2023-11-28 16:26:50

24

4

下面的 MWE 显示了两种对相同 2D 核密度估计进行积分的方法，这些估计是为 this data 获得的。使用 stats.gaussian_kde()功能。

对所有 (x, y) 执行集成低于阈值点 (x1, y1) ，它定义了积分上限(积分下限为 -infinity ；参见 MWE)。

int1函数使用简单的蒙特卡罗方法。
int2函数使用 scipy.integrate.nquad功能。

问题是 int1 (即:蒙特卡洛方法)系统地给出比 int2 更大的积分值.我不知道为什么会这样。

下面是 int1 运行 200 次后获得的积分值示例(蓝色直方图)与 int2 给出的积分结果(红色垂直线):

导致积分值差异的原因是什么？

MWE

import numpy as np
import matplotlib.pyplot as plt
from scipy import stats
from scipy import integrate


def int1(kernel, x1, y1):
    # Compute the point below which to integrate
    iso = kernel((x1, y1))

    # Sample KDE distribution
    sample = kernel.resample(size=50000)

    # Filter the sample
    insample = kernel(sample) < iso

    # The integral is equivalent to the probability of drawing a
    # point that gets through the filter
    integral = insample.sum() / float(insample.shape[0])

    return integral


def int2(kernel, x1, y1):

    def f_kde(x, y):
        return kernel((x, y))

    # 2D integration in: (-inf, x1), (-inf, y1).
    integral = integrate.nquad(f_kde, [[-np.inf, x1], [-np.inf, y1]])

    return integral


# Obtain data from file.
data = np.loadtxt('data.dat', unpack=True)
# Perform a kernel density estimate (KDE) on the data
kernel = stats.gaussian_kde(data)

# Define the threshold point that determines the integration limits.
x1, y1 = 2.5, 1.5

i2 = int2(kernel, x1, y1)
print i2

int1_vals = []
for _ in range(200):
    i = int1(kernel, x1, y1)
    int1_vals.append(i)
    print i

添加

请注意，此问题源自 this answer .起初我没有注意到答案在使用的积分限制中是错误的，这解释了为什么结果在 int1 之间。和 int2是不同的。

int1正在整合域 f(x,y)<f(x1,y1) (其中 f 是核密度估计)，而 int2集成在域 (x,y)<(x1,y1) .

最佳答案

您对分布重新采样

sample = kernel.resample(size=50000)

然后计算每个采样点的概率小于边界处的概率

insample = kernel(sample) < iso

这是不正确的。考虑边界 (0,100) 并假设您的数据具有 u=(0,0) 和 cov=[[100,0],[0,100]]。点 (0,50) 和 (50,0) 在该内核中具有相同的概率，但只有其中一个在边界内。由于两者都通过了测试，因此您进行了过度采样。

您应该测试 sample 中的每个点是否在边界内，然后计算概率。有点像

def int1(kernel, x1, y1):
    # Sample KDE distribution                                                                                                              
    sample = kernel.resample(size=100)

    include = (sample < np.repeat([[x1],[y1]],sample.shape[1],axis=1)).all(axis=0)
    integral = include.sum() / float(sample.shape[1])
    return integral

我用下面的代码测试了这个

def measure(n):

    m1 = np.random.normal(size=n)
    m2 = np.random.normal(size=n)
    return m1,m2

a = scipy.stats.gaussian_kde( np.vstack(measure(1000)) )
print(int1(a,-10,-10))
print(int2(a,-10,-10))
print(int1(a,0,0))
print(int2(a,-0,-0))

产量

0.0
(4.304674927251112e-232, 4.6980863813551415e-230)
0.26
(0.25897626178338407, 1.4536217446381293e-08)

蒙特卡洛积分应该像这样工作

在 x/y 的可能值的某个子集上抽取 N 个随机值(均匀地，而不是来自您的分布)(下面我将其与平均值相差 10 个 SD)。
对于每个随机值计算核(rand_x,rand_y)
计算总和并乘以(体积)/N_samples

在代码中:

def mc_wo_sample(kernel,x1,y1,lboundx,lboundy):
    nsamples = 50000
    volume = (x1-lboundx)*(y1-lboundy)
    # generate uniform points in range                                                                                                     
    xrand = np.random.rand(nsamples,1)*(x1-lboundx) + lboundx
    yrand = np.random.rand(nsamples,1)*(y1-lboundy) + lboundy
    randvals = np.hstack((xrand,yrand)).transpose()
    print randvals.shape
    return (volume*kernel(randvals).sum())/nsamples

运行以下

   print(int1(a,-9,-9))
   print(int2(a,-9,-9))
   print(mc_wo_sample(a,-9,-9,-10,-10))
   print(int1(a,0,0))
   print(int2(a,-0,-0))
   print(mc_wo_sample(a,0,0,-10,-10))

产量

0.0
(4.012958496109042e-70, 6.7211236076277e-71)
4.08538890986e-70
0.36
(0.37101621760650216, 1.4670898180664756e-08)
0.361614657674

关于python - 使用 Monte Carlo 与 scipy.integrate.nquad 的不同积分结果，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/35902531/

24

4

0

文章推荐： javascript - 这是非法语法吗？

文章推荐： css - border-top 线性渐变？

文章推荐： javascript - JSON 和 JavaScript 语法

文章推荐： python - 这段代码中有哪些反模式和错误？

machine-learning - 首次访问与每次访问 Monte Carlo
我最近一直在研究强化学习。为此，我一直在阅读萨顿的名著，但还有一些我还没有完全理解的地方。对于蒙特卡洛学习，我们可以在首次访问和每次访问算法之间进行选择，并且可以证明两者都渐进地收敛到正确的解决方案
c++ - 加速 Monte Carlo Pi
我编写了一个 C++ 程序，用于通过“将随机点放入四分之一圆中并计算它们等”来计算圆周率。现在我的程序在我看来有点慢，我想过一些改进来加快它的速度(源代码在下面)。我的第一个想法是使用 OpenMP
C#、日期时间格式、mont 名称、cultureinfo
我目前正在开发一个小程序，我想根据 cultureinfo 清楚地显示日期和时间，如下所示:2017 年 3 月 3 日星期日上午 7:46:57 但是，我希望可以选择任何国家，并根据他们写日期的方式
c++ - Monte Carlo Sims - 请检查我的算法
基本上，这个问题模拟了以下内容: 有一个装有 50 个绿球和 50 个红球的瓮。我可以从 jar 里取出球，无需更换，规则如下:每取出一个红球，我将损失一美元，每取出一个绿色球，我将获得一美元。我
performance - 为什么这个 Monte Carlo Haskell 程序这么慢？
更新: 我的编译命令是ghc -O2 Montecarlo.hs。我的随机版本是random-1.1，ghc版本是8.6.4，我的系统是macOS Big Sur 11.1(Intel芯片)。我用来测
r - 基于置换法的方差分析中 F 统计量的 Monte Carlo 估计
我正在尝试使用组标识符 g 在 (y1,...,yN) 上对 ANOVA 进行排列检验.我应该使用 (1)/(g-1) (muhatj - muhat)^2 的总和作为测试统计量，而 muhatj 是
R代码: Is there a way to make this Monte Carlo simulation quicker?
想象一下我递给你一个上面印有“-1”的乒乓球。然后我告诉你从标有“第一袋”的袋子中取出另一个乒乓球。这个袋子里有 30,000 个球，有的标有“-1”，有的标有“0”，有的标有“+1”。无论您抽到哪个
python - mcint 模块 Python-Monte Carlo 集成
我正在尝试运行一个代码，通过使用蒙特卡罗积分对一维高斯分布方程进行积分来输出高斯分布。我正在尝试使用 mcint 模块。我定义了 mcint 模块中使用的高斯方程和采样器函数。我不确定 mcint 函
r - 如何在 R 中为 Monte Carlo 创建更有效的模拟循环
此练习的目的是创建营养摄入值的人口分布。之前的数据中有重复的度量，这些已被删除，因此每一行都是数据框中的唯一人。我有这个代码，当使用少量我的数据框行进行测试时，它工作得很好。对于所有 7135 行，
c# - 优化 Poker-Monte-Carlo-Simulation 的手牌评估算法
我已经为 Hold'em Poker 编写了一个平衡器作为一个业余项目。它工作正常，但还有一件事我不满意:在整个模拟手的过程中，评估手的过程大约占用了35%的时间。与迭代和克隆大型数组等其他必须完成的
python - 在 python 中加速 monte carlo 代码
考虑从 [0,T) 开始按递增顺序给出的点 Y。我们要将这些点视为位于圆周 T 的圆上。现在考虑来自 [0,T) 的点 X 也位于圆周 T 的圆上。我们说 X 和 Y 之间的距离是 X 中的每个点与
r - 使用 R 来尊重 LatinHypercube/Monte Carlo 试验的相关性
我目前正在使用 python 和 RPY 来使用 R 中的功能。我如何使用 R 库生成蒙特卡罗样本，以尊重 2 个变量之间的相关性.. 例如如果变量 A 和 B 具有 85% (0.85) 的相关
python - Python 中的 Monte Carlo 和 Metropolis 算法非常慢
我正在尝试用 Python 实现一个简单的蒙特卡洛(我对此还很陌生)。来自 C 我可能走的是最错误的道路，因为我的代码对于我所要求的来说太慢了:对于 60 个 3d 粒子和周期性边界条件(PBC)，我
r - R 中的 Monte Carlo 模拟、Bootstrap 和回归
我已经使用 SAS 很长时间了，现在我想用 R 翻译我的代码。我需要帮助来执行以下操作: 生成多个引导样本对每个样本运行线性回归模型通过复制样本将参数存储在新数据集中为了更清晰，我编辑了这段代码
基于 Monte Carlo 的 Pi 计算的 Python 高效矢量化
为了近似 Pi 的值，请考虑使用随机值填充数组并测试是否包含单位圆的随机方法， import random as rd import numpy as np def r(_): return rd.r
algorithm - 固定 x 的 Monte Carlo pi 方法
在我发现的所有计算 pi 的蒙特卡洛示例代码中，x 和 y 都是在 0 和 1 之间随机生成的。例如，示例代码如下所示 Ran rdm(time(NULL)); double x, y;
R:通过 Permute 或 Sample 函数的 Monte Carlo 程序以生成零分布
从这个数据集中，我有我的聚类分析分配的所有患者样本(总共 69 行)，并且聚类被标记为第 3 列“Cluster.assigned”，总共 8 个聚类，每个聚类大小不等。其他列包含变量，其中我想测试数
machine-learning - 如何使用 PyTorch 计算 Monte Carlo Dropout 神经网络的不确定性？
我正在尝试在 Pytorch 上使用 Mc Dropout 实现贝叶斯 CNN，主要思想是通过在测试时应用 dropout 并运行多次前向传递，您可以获得来自各种不同模型的预测。我需要获得不确定性，有
r - 如何在 R 中使用 Monte Carlo 进行 ARIMA 模拟函数
这是我想用 R 做的算法: 模拟来自 ARIMA 的 10 个时间序列数据集模型通arima.sim()功能将系列拆分为可能的子系列 2s , 3s , 4s , 5s , 6s , 7s , 8s
python - 使用 Monte Carlo 与 scipy.integrate.nquad 的不同积分结果
下面的 MWE 显示了两种对相同 2D 核密度估计进行积分的方法，这些估计是为 this data 获得的。使用 stats.gaussian_kde()功能。对所有 (x, y) 执行集成低于阈值

首页

博学

6Ren·AI

商城

python - 使用 Monte Carlo 与 scipy.integrate.nquad 的不同积分结果