- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
from scipy import stats
import numpy as np
class your_distribution(stats.rv_continuous):
def _pdf(self, x):
p0 = 10.9949
p1 = 0.394447
p2 = 12818.4
p3 = 2.38898
return ((p1*p3)/(p3*p0+p2*p1))*((p0*np.exp(-1.0*p1*x))+(p2*np.exp(-1.0*p3*x)))
distribution = your_distribution(a=0.15, b=10.1)
sample = distribution.rvs(size=50000)
上面的代码从 0.15 到 10.1 范围内的归一化 pdf 生成 50000 个样本。但是,在上限 b=10.1
处生成了不成比例的大量样本。这没有意义,如绘制 pdf 时所见。
我该如何解决这个问题?
最佳答案
PDF 已针对整个分布范围正确标准化。但是,设置 a
和 b
只会剪切 PDF,而不会进行任何重新规范化。使用 (a=0.15, b=10.1)
PDF 不再集成到 1,并且由于 scipy 实现的一个怪癖,剩余的密度显然被添加到范围的末尾。这导致在上界的大量样本。
我们可以通过绘制 a=0 和 a=0.15 的累积密度函数 (CDF) 来可视化正在发生的事情:
x = np.linspace(0, 15, 1000)
distribution = your_distribution(a=0.0, b=10.1)
plt.plot(x, distribution.cdf(x), label='a=0')
distribution = your_distribution(a=0.15, b=10.1)
plt.plot(x, distribution.cdf(x), label='a=0.15')
plt.legend()
为了消除 CDF 中的跳跃和较高范围内的虚假样本,我们需要针对 a..b 范围重新归一化 PDF。我懒得分析得出正确的因素,所以让 scipy 来做艰苦的工作:
from scipy import stats
from scipy.integrate import quad
import numpy as np
# I pulled the definition of the PDF out of the class so we can use it to
# compute the scale factor.
def pdf(x):
p0 = 10.9949
p1 = 0.394447
p2 = 12818.4
p3 = 2.38898
return ((p1*p3)/(p3*p0+p2*p1))*((p0*np.exp(-1.0*p1*x))+(p2*np.exp(-1.0*p3*x)))
class your_distribution(stats.rv_continuous):
def __init__(self, *args, **kwargs):
super().__init__(*args, **kwargs)
# integrate area of the PDF in range a..b
self.scale, _ = quad(pdf, self.a, self.b)
def _pdf(self, x):
return pdf(x) / self.scale # scale PDF so that it integrates to 1 in range a..b
distribution = your_distribution(a=0.15, b=10.1)
sample = distribution.rvs(size=1000)
如果您碰巧知道积分的解析解,您可以使用它来代替调用 quad
。
关于python - Scipy rv_continuous 错误地从分布生成样本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50857909/
from scipy import stats import numpy as np class your_distribution(stats.rv_continuous): def _pd
我有以下代码片段: from scipy import stats class my_distribution(stats.rv_continuous): def __init__(self)
我正在尝试为我根据数据生成/估计的一些 pdf 计算 E[f(x)]。 文档中说: Subclassing New random variables can be defined by subclas
我一直在寻找关于如何使用 rv_continuous 的好的教程或示例,但一直找不到。 我读了: http://docs.scipy.org/doc/scipy/reference/generated
我想自己生成一个有界分布函数。但我在上限中看到了奇怪的行为。这是我的代码: import matplotlib.pyplot as plt from scipy.stats import rv_con
我有以下 scipy.stats.rv_continuous 的子类: from scipy.stats import rv_continuous import math class Distribu
在我的 Python 项目中,我像这样扩展 scipy.stats.rv_continuous: class GenlogisticGen(LmomDistrMixin, scipy.stats.rv
我包含了我在下面编写的代码。由于某种原因,与初始分布相比,上限 0.804 被过度采样。我正在使用的两个发行版都会出现这种情况。 这是 rv_continuous 的常见问题还是我遗漏了什么? imp
编辑:计算出分布。并使其大部分工作,除了形状参数为负时。 PDF 应该适用于负形状值,但不适用于子类分布。 我正在尝试使用 scipy 统计数据创建偏态正态分布。我现在只需要PDF。 我对 rv_co
最终,我试图将两个 PDF 之间的 copula 可视化,这两个 PDF 是根据数据估计的(均通过 KDE)。假设,对于其中一个 KDE,我将离散的 x,y 数据排序在一个名为 data 的元组中。我
我正在尝试生成具有特定光度的 QSO 的随机概率密度函数,其形式为: 1/( (L/L_B^* )^alpha + (L/L_B^* )^beta ) 其中 L_B^*、alpha 和 beta 都是
我试图使用 scipy.stats.rv_continuous 对给定概率密度函数(pdf)的随机变量进行采样: class Distribution(stats.rv_continuous):
以下最小示例似乎存在内存泄漏(使用 SciPy 版本 0.17.0 进行测试) import resource from scipy.stats import rv_continuous class
我正在尝试通过子类化 rv_continuous 来生成二维均匀分布. from scipy import stats class uniform_2d(stats.rv_continuous):
我想为一些可能受离散分布支配的数据找到最大似然估计。但是在 scipy.stats 中,只有代表连续分布的类才有合适的函数来做到这一点。代表离散分布的类不代表的原因是什么? 最佳答案 简短的回答:因为
我是一名优秀的程序员,十分优秀!