- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我正在尝试使用库 pomegranate 来近似 Beta 分布。然而,当我尝试从生成的数据中近似参数时,我得到了非常不同的参数。重现该错误的代码如下
import numpy as np
from pomegranate import *
X = np.random.beta(1, 5, size=10000).reshape(-1, 1) # sample from beta distribution with alpha = 1, beta = 5
print(BetaDistribution.from_samples(X).parameters) # approximate beta parameters
>>> [0.0, 10000.0] # error here
我不确定错误从何而来。好像是测试文件test_distributions.py产生正确的答案。如果有任何关于如何修复 pomegranate
或在 pomegranate
中创建自定义模型的建议,我们将不胜感激。
注意我使用的是Python 3.6.8
最佳答案
按照这个issue回答 , 当前库中提供的 BetaDistribution
是 beta 二项式分布而不是 beta 分布。这就是为什么该模型无法拟合 beta 分布的样本。
解决方案
我使用 BayesianOptimization
得到了解决方法图书馆。基本上,我尝试使用贝叶斯优化库最大化给定数据的分布的对数似然。以下代码对于混合分布也具有很好的概括性。
from bayes_opt import BayesianOptimization
data = np.random.beta(1, 5, size=10000) # create data
def beta_loss(a, b):
beta_loss = BetaDistribution(a, b).probability(data)
return np.log(beta_loss).sum()
optimizer = BayesianOptimization(
f=beta_loss,
pbounds={'a': (0.5, 5),
'b': (0.5, 20)},
random_state=10
)
# optimize the parameters
optimizer.maximize(
init_points=5,
n_iter=100
)
# plot approximated distribution vs. distribution of the data
x = np.arange(0, 1, 0.01)
plt.hist(data, density=True, bins=100, alpha=0.1)
a, b = [v for k, v in optimizer.max['params'].items()]
plt.plot(x, BetaDistribution(a, b).probability(x))
plt.show()
这里我只是举例说明如何优化Beta分布和高斯分布混合的参数:
from bayes_opt import BayesianOptimization
# example data of beta/gaussian distribution
data = np.hstack((np.random.beta(1, 10, size=2000),
np.random.randn(1000) * 0.2 + 0.6))
data = data[np.logical_and(data >= 0.0, data <= 1.0)]
def loss_bimodal(a, b, mu, sigma, w1):
beta_loss = BetaDistribution(a, b).probability(data)
norm_loss = NormalDistribution(mu, sigma).probability(data)
return np.log(w1 * beta_loss + (1 - w1) * norm_loss).sum()
def pdf_bimodal(a, b, mu, sigma, w1, x=np.arange(0, 1, 0.01)):
return w1 * BetaDistribution(a, b).probability(x) + \
(1 - w1) * NormalDistribution(mu, sigma).probability(x)
optimizer = BayesianOptimization(
f=loss_bimodal,
pbounds={'mu': (0., 1.),
'sigma': (0., 1.),
'a': (0.5, 5),
'b': (1, 25),
'w1': (0., 1.)},
random_state=1
)
optimizer.maximize(
init_points=5,
n_iter=100
)
使用优化后的参数绘制分布图,如下所示:
a, b, mu, sigma, w1 = [v for k, v in optimizer.max['params'].items()]
x = np.arange(0, 1, 0.01)
plt.plot(x, pdf(a, b, mu, sigma, w1, x))
plt.hist(data, density=True, bins=100)
plt.show()
关于python - 使用 Pomegranate 拟合 Beta 分布,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55463791/
gnuplot 中拟合函数的正确方法是什么 f(x)有下一个表格吗? f(x) = A*exp(x - B*f(x)) 我尝试使用以下方法将其拟合为任何其他函数: fit f(x) "data.txt
(1)首先要建立数据集 ? 1
测量显示一个信号,其形式类似于具有偏移量和因子的平方根函数。如何找到系数并在一个图中绘制原始数据和拟合曲线? require(ggplot2) require(nlmrt) # may be thi
我想将以下函数拟合到我的数据中: f(x) = Offset+Amplitudesin(FrequencyT+Phase), 或根据 Wikipedia : f(x) = C+alphasin(ome
我正在尝试使用与此工具相同的方法在 C# 中拟合 Akima 样条曲线:https://www.mycurvefit.com/share/4ab90a5f-af5e-435e-9ce4-652c95c
问题:开放层适合 map ,只有在添加特征之后(视觉),我该如何避免这种情况? 我在做这个 第 1 步 - 创建特征 var feature = new ol.Feature({...}); 第 2
我有一个数据变量,其中包含以下内容: [Object { score="2.8", word="Blue"}, Object { score="2.8", word="Red"}, Objec
我正在尝试用中等大小的 numpy float 组来填充森林 In [3]: data.shape Out[3]: (401125, 5) [...] forest = forest.fit(data
我想用洛伦兹函数拟合一些数据,但我发现当我使用不同数量级的参数时拟合会出现问题。 这是我的洛伦兹函数: function [ value ] = lorentz( x,x0,gamma,amp )
我有一些数据,我希望对其进行建模,以便能够在与数据相同的范围内获得相对准确的值。 为此,我使用 polyfit 来拟合 6 阶多项式,由于我的 x 轴值,它建议我将其居中并缩放以获得更准确的拟合。 但
我一直在寻找一种方法来使数据符合 beta 二项分布并估计 alpha 和 beta,类似于 VGAM 库中的 vglm 包的方式。我一直无法找到如何在 python 中执行此操作。有一个 scipy
我将 scipy.optimize.minimize ( https://docs.scipy.org/doc/scipy/reference/tutorial/optimize.html ) 函数与
在过去的几天里,我一直在尝试使用 python 绘制圆形数据,方法是构建一个范围从 0 到 2pi 的圆形直方图并拟合 Von Mises 分布。我真正想要实现的是: 具有拟合 Von-Mises 分
我有一个简单的循环,它在每次迭代中都会创建一个 LSTM(具有相同的参数)并将其拟合到相同的数据。问题是迭代过程中需要越来越多的时间。 batch_size = 10 optimizer = opti
我有一个 Python 系列,我想为其直方图拟合密度。问题:是否有一种巧妙的方法可以使用 np.histogram() 中的值来实现此结果? (请参阅下面的更新) 我目前的问题是,我执行的 kde 拟
我有一个简单的 keras 模型(正常套索线性模型),其中输入被移动到单个“神经元”Dense(1, kernel_regularizer=l1(fdr))(input_layer) 但是权重从这个模
我正在尝试解决 Boston Dataset 上的回归问题在random forest regressor的帮助下.我用的是GridSearchCV用于选择最佳超参数。 问题一 我是否应该将 Grid
使用以下函数,可以在输入点 P 上拟合三次样条: def plotCurve(P): pts = np.vstack([P, P[0]]) x, y = pts.T i = np.aran
我有 python 代码可以生成数字 x、y 和 z 的三元组列表。我想使用 scipy curve_fit 来拟合 z= f(x,y)。这是一些无效的代码 A = [(19,20,24), (10,
我正在尝试从 this answer 中复制代码,但是我在这样做时遇到了问题。我正在使用包 VGAM 中的gumbel 发行版和 fitdistrplus . 做的时候出现问题: fit = fi
我是一名优秀的程序员,十分优秀!