- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我正在尝试找出如何使用 pymc
正确制作离散状态马尔可夫链模型.
举个例子(在 nbviewer 中查看),让我们创建一个长度为 T=10 的链,其中马尔可夫状态是二进制的,初始状态分布是 [0.2, 0.8] 并且在状态 1 中切换状态的概率是 0.01 而在状态 2 是 0.5
import numpy as np
import pymc as pm
T = 10
prior0 = [0.2, 0.8]
transMat = [[0.99, 0.01], [0.5, 0.5]]
为了制作模型,我制作了一个状态变量数组和一个取决于状态变量的转换概率数组(使用 pymc.Index 函数)
states = np.empty(T, dtype=object)
states[0] = pm.Categorical('state_0', prior0)
transPs = np.empty(T, dtype=object)
transPs[0] = pm.Index('trans_0', transMat, states[0])
for i in range(1, T):
states[i] = pm.Categorical('state_%i' % i, transPs[i-1])
transPs[i] = pm.Index('trans_%i' %i, transMat, states[i])
对模型进行采样表明状态边缘是它们应该的状态(与在 Matlab 中使用 Kevin Murphy 的 BNT 包构建的模型相比)
model = pm.MCMC([states, transPs])
model.sample(10000, 5000)
[np.mean(model.trace('state_%i' %i)[:]) for i in range(T)]
打印出来:
[-----------------100%-----------------] 10000 of 10000 complete in 7.5 sec
[0.80020000000000002,
0.39839999999999998,
0.20319999999999999,
0.1118,
0.064199999999999993,
0.044600000000000001,
0.033000000000000002,
0.026200000000000001,
0.024199999999999999,
0.023800000000000002]
我的问题是——这似乎不是用 pymc 构建马尔可夫链的最优雅的方式。有没有不需要确定性函数数组的更简洁的方法?
我的目标是为更通用的动态贝叶斯网络编写一个基于 pymc 的包。
最佳答案
据我所知,您必须将每个时间步长的分布编码为前一个时间步长的确定性函数,因为它就是这样——参数中不涉及随机性,因为您在问题集中定义了它们-向上。但是,我认为您的问题可能更多地是为了寻找一种更直观的方式来表示模型。一种替代方法是直接将时间步转换编码为前一个时间步的函数。
from pymc import Bernoulli, MCMC
def generate_timesteps(N,p_init,p_trans):
timesteps=np.empty(N,dtype=object)
# A success denotes being in state 2, a failure being in state 1
timesteps[0]=Bernoulli('T0',p_init)
for i in xrange(1,N):
# probability of being in state 1 at time step `i` given time step `i-1`
p_i = p_trans[1]*timesteps[i-1]+p_trans[0]*(1-timesteps[i-1])
timesteps[i] = Bernoulli('T%d'%i,p_i)
return timesteps
timesteps = generate_timesteps(10,0.8,[0.001,0.5])
model = MCMC(timesteps)
model.sample(10000) # no burn in necessary since we're sampling directly from the distribution
[np.mean( model.trace(t).gettrace() ) for t in timesteps]
关于python - 如何使用 pymc 制作离散状态马尔可夫模型?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22636974/
我在学习道路上遇到了一项任务。 对于均值 μ=np 和方差 σ**2=np(1−p) 的二项式分布 X∼Bp,n,我们希望上限概率 P (X≥c⋅μ) 对于 c≥1。三界介绍: Formulas 任务
给定以下马尔可夫矩阵: import numpy, scipy.linalg A = numpy.array([[0.9, 0.1],[0.15, 0.85]]) 平稳概率存在且等于[.6, .4]。
我是一名优秀的程序员,十分优秀!