python - PYMC3:NUTS 难以从分层零膨胀 Gamma 模型中采样-6ren

python - PYMC3:NUTS 难以从分层零膨胀 Gamma 模型中采样

转载作者：行者123 更新时间：2023-11-28 17:19:16

24

4

我正在尝试从 a paper from Richard McElreath 复制数据分析，其中他用分层零膨胀 Gamma 模型拟合数据。该数据是关于 15000 次狩猎之旅的狩猎返回，来自大约 150 猎人超过 20 年。由于很多狩猎旅行的返回为零，该模型假设每次旅行都有 pi 的零返回概率和 1 - pi 的正返回概率，其服从 Gamma 分布参数 alpha 和 beta。

预测变量是年龄，该模型使用年龄多项式(最多 3 阶)来建模 pi 和 alpha。由于 15000 次旅行属于 150 个猎人，每个猎人都有自己的系数，并且所有系数都遵循共同的多元正态分布。模型详情请引用以下代码。 model specification 貌似没问题，但是NUTS开始采样时遇到了问题:大约20分钟后只给出了大约10个样本，采样器就停在那里，并告诉我需要数百小时才能完成采样。我想知道是什么导致了这些问题。

通常的导入

import pymc3 as pm
import numpy as np
from pymc3.distributions import Continuous, Gamma
import theano.tensor as tt

数据可以从github获取

n_trip = len(d)
n_hunter = len(d['hunter.id'].unique())
idx_hunter = d['hunter.id'].values

y = d['kg.meat'].values
age = d['age.s'].values
age2 = (d['age.s'].values)**2
age3 = (d['age.s'].values)**3

零膨胀 Gamma 的对数概率密度函数。

class ZeroInflatedGamma(Continuous):
    def __init__(self, alpha, beta, pi, *args, **kwargs):
        super(ZeroInflatedGamma, self).__init__(*args, **kwargs)
        self.alpha = alpha
        self.beta = beta
        self.pi = pi = tt.as_tensor_variable(pi)
        self.gamma = Gamma.dist(alpha, beta)

    def logp(self, value):
        return tt.switch(value > 0,
                         tt.log(1 - self.pi) + self.gamma.logp(value),
                         tt.log(self.pi))

这是一个索引 9X9 矩阵之前的相关矩阵的矩阵，pymc3 中的 LKJ 先验是作为一维向量给出的

dim = 9
n_elem = dim * (dim - 1) / 2
tri_index = np.zeros([dim, dim], dtype=int)
tri_index[np.triu_indices(dim, k=1)] = np.arange(n_elem)
tri_index[np.triu_indices(dim, k=1)[::-1]] = np.arange(n_elem)

这是模型

with pm.Model() as Vary9_model:

    # hyper-priors
    mu_a = pm.Normal('mu_a', mu=0, sd=100, shape=9)
    sigma_a = pm.HalfCauchy('sigma_a', 5, shape=9)

    # build the covariance matrix
    C_triu = pm.LKJCorr('C_triu', n=2, p=9)    
    C = tt.fill_diagonal(C_triu[tri_index], 1)
    sigma_diag = tt.nlinalg.diag(sigma_a)
    cov = tt.nlinalg.matrix_dot(sigma_diag, C, sigma_diag)

    # priors for each hunter and all the linear components, 9 dimensional Gaussian  
    a = pm.MvNormal('a', mu=mu_a, cov=cov, shape=(n_hunter, 9))

    # linear function  
    mupi = a[:,0][idx_hunter] + a[:,1][idx_hunter] * age + a[:,2][idx_hunter] * age2 + a[:,3][idx_hunter] * age3
    mualpha = a[:,4][idx_hunter] + a[:,5][idx_hunter] * age + a[:,6][idx_hunter] * age2 + a[:,7][idx_hunter] * age3

    pi = pm.Deterministic('pi', pm.math.sigmoid(mupi))
    alpha = pm.Deterministic('alpha', pm.math.exp(mualpha))
    beta = pm.Deterministic('beta', pm.math.exp(a[:,8][idx_hunter]))

    y_obs = ZeroInflatedGamma('y_obs', alpha, beta, pi, observed=y)

    Vary9_trace = pm.sample(6000, njobs=2)

这是模型的状态:

Auto-assigning NUTS sampler...
Initializing NUTS using advi...
Average ELBO = -28,366: 100%|██████████| 200000/200000 [15:36<00:00, 213.57it/s]
Finished [100%]: Average ELBO = -28,365
  0%|          | 22/6000 [15:51<63:49:25, 38.44s/it]

我对这个问题有一些想法，但不确定可能是什么原因。

九维高斯太难采样了吗？我以前只将 mualpha 和 mupi 的截距建模为双变量高斯分布，它很慢但有效(模型拟合大约需要 20 分钟)
是概率密度导致了问题吗？我自己编写了密度函数，但不确定它是否运行良好。我认为密度函数在零处不可微，这会给坚果采样器带来麻烦吗？
是因为预测变量高度相关吗？该模型中的线性模型组件是年龄的三次多项式，自然预测变量高度相关。

还是因为其他原因？

附带说明一下，我尝试使用 Metropolis 采样器，但我的计算机内存不足，链仍然没有收敛。

最佳答案

ZeroInflatedGamma 看起来不错。密度函数关于 pi、alpha 和 beta 是可微分的。这就是观察变量所需的全部。如果您要估算值，则只需要关于值的导数。

LKJCorr 的实现有一个问题: https://github.com/pymc-devs/pymc3/pull/1863你可以在master上再试一次。遗憾的是，pymc3 不支持在 cholesky 分解参数化中使用 MVNormal 和 LKJCorr。这也可能有帮助。在 github 上有一个正在进行的拉取请求: https://github.com/pymc-devs/pymc3/pull/1875

为了提高收敛性，您可以尝试对 a 进行非中心参数化。类似的东西

a_raw = pm.Normal('a_raw', shape=(9, n_hunter))
a = mu_a[None, :] + tt.dot(tt.slinalg.cholesky(cov), a_raw)

当然，如果我们有胆小的 LKJCorr，这会更快......

关于python - PYMC3:NUTS 难以从分层零膨胀 Gamma 模型中采样，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/42409761/

24

4

0

文章推荐： javascript - React.js 和具有动态宽度的水平 IScroll 5

文章推荐： javascript - 将字符串转换为日期而不考虑时区 - Typescript

文章推荐：单击时jquery动画不会返回

java - 膨胀 View
我需要使用view.getWidth()，但我不能，因为我还没有膨胀 View 。在使用 view.getWidth() 之前如何膨胀 View ？ MainActivity 类: p
Android 膨胀 View
这个问题很难尝试和表述，但我会尽力而为。基本上，我有一个应用程序，我想将代码拆分得更多。为了尝试解释这一点，我将举一个我的屏幕示例。在我的主屏幕上，我有一个标题、用户详细信息、余额、下一个账单详细
android - 膨胀 TableRow
我有一个 TableLayout，我在其中动态添加行，一开始是空的，我想在用户单击它时在该行中加载一个 xml。我已经给行赋值了OnClick方法，但是不知道在onclick方法中进入时如何加载xm
C++ 是否在多个文件单元中链接相同的静态库会增加大小/膨胀？
我使用的是 C++ 中的 libcurl 库，这是一个相当大的库(.lib 文件大约 2MB)，项目是用 CURL_STATICLIB 编译的至于现在我只有一个 .cpp 文件，其中包含 heade
png - 是什么让我的 png 膨胀？
背景: 我正在努力使一堆 PNG 尽可能小。我正在使用诸如 PngOut、PngCrush 和 OptiPng 之类的工具。问题: 我遇到了一个大小为 1434 KB 但只有 230 x 230 像
ruby-on-rails - 新遗物导致内存泄漏/膨胀？
我一直在努力找出我的应用程序使用的内存不断增长的原因，直到在 heroku 上的生产中它失败并下降。经过一些相当广泛的研究，使用 Top 观察 RSIZE 在本地增长并使用 Oink 尝试查明我只是
javascript - 膨胀 zlib 压缩数据
我有一个使用 C++ 版本的 zlibs deflate 压缩的数据 ArrayBuffer(使用默认值)。由于没有服务器，我现在需要在客户端中增加这些数据。我已经使用 C++ 中的默认 inflat
java - 将按钮/编辑文本添加到相对布局(膨胀)
我的代码有问题: @Override public View getView(int position, View convertView, ViewGroup parent) {
java - 膨胀 fragment 时出错
我有一个 fragment ，我像下面一样对其进行膨胀，但它给出了运行时错误: public View onCreateView(LayoutInflater inflater, ViewGroup
java - 膨胀 Facebook 登录按钮时出错。
我正在学习 Fragment，并且我是通过在 Fragment 中使用 FB Login 来学习的。但我不断收到异常 Error inflateing class com.facebook.login
android - 膨胀 subview 的两种方法之间有什么区别吗？
第一种方法: LinearLayout parent = ...; View child = LayoutInflator.inflate(context, parent, true); 第二种方法:
javascript - 是否有任何标准化的方法来处理 Bower 膨胀？
我刚刚完成了一个站点构建，在该站点构建中，我们必须将文件提供给第 3 方以与他们的系统集成。构建必须是独立的，因为会有多方部署它们，能力水平各不相同。我遇到的问题是，在下载我的 Javascript
android - '膨胀' LayoutInflater 无法膨胀的布局
我正在寻找一种方法来“扩充”Android XML 布局，这在编译时是未知的。我已经搜索了几个小时，总能找到答案，这是不可能的，因为 LayoutInflater 不能使用简单的 XML 文件。好的，
android - 膨胀 ListView 时出错
我有一个从 Faragment 扩展而来的类，叫做 Agenda。它的布局有一个 listView，但是当这个类返回到主 Activity 时，我得到了一个错误。这是错误和代码: > 03-11 13
android - 膨胀 ListFragment 类时出错
我的应用程序一启动就崩溃了。我收到以下错误: android.view.InflateException: Binary XML file line #34: Error inflating clas
java - 膨胀 View 与膨胀元素
我想膨胀 R.id.catText，但如果我自己膨胀它，它永远不会显示。如果我inflate R.id.assets(容器)，那么两个元素都会正常显示。我只是不想要容器。如何在不膨胀 R.id.ass
android - 膨胀 View 为空
我尝试创建自定义 ViewGroup 类，但是当我使用方法 findViewById() 时它返回 null，但展开 View 是可以的。代码是: public class HorizontalLi
android - 膨胀 xml 中的类集时出错
我正在尝试创建一个在屏幕上滑动的 textView，但它会产生错误，但我不知道为什么。这是我的 xml: 还有我的 Activity 课: package com.exampl
java - 膨胀 MaterialAnimatedSwitch 时出错
我正在构建一个应用程序，我在其中使用了 glomadrain 的动画切换按钮。完成编码后出现以下错误: at com.android.internal.os.ZygoteInit.main(Zygot
android - 膨胀 fragment 时出错
我只是想按照 android dev 上的示例代码来膨胀 Activity 中的 fragment 。我有一个更复杂的项目正在工作，但我遇到了与这里的简单项目相同的错误。谁能指出我正确的方向？扩展

首页

博学

6Ren·AI

商城

python - PYMC3:NUTS 难以从分层零膨胀 Gamma 模型中采样