- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
在使用 statsmodels
中的 UnobservedComponents
拟合本地级别模型后,我们正在尝试寻找使用结果模拟新时间序列的方法。像这样的东西:
import numpy as np
import statsmodels as sm
from statsmodels.tsa.statespace.structural import UnobservedComponents
np.random.seed(12345)
ar = np.r_[1, 0.9]
ma = np.array([1])
arma_process = sm.tsa.arima_process.ArmaProcess(ar, ma)
X = 100 + arma_process.generate_sample(nsample=100)
y = 1.2 * x + np.random.normal(size=100)
y[70:] += 10
plt.plot(X, label='X')
plt.plot(y, label='y')
plt.axvline(69, linestyle='--', color='k')
plt.legend();
ss = {}
ss["endog"] = y[:70]
ss["level"] = "llevel"
ss["exog"] = X[:70]
model = UnobservedComponents(**ss)
trained_model = model.fit()
在给定外生变量 X[70:]
的情况下,是否可以使用 trained_model
来模拟新的时间序列?就像我们有 arma_process.generate_sample(nsample=100)
一样,我们想知道我们是否可以做类似的事情:
trained_model.generate_random_series(nsample=100, exog=X[70:])
其背后的动机是,我们可以计算时间序列与观察到的 y[70:]
一样极端的概率(用于识别响应的 p 值大于预测值一个)。
[编辑]
阅读 Josef 和 cfulton 的评论后,我尝试执行以下操作:
mod1 = UnobservedComponents(np.zeros(y_post), 'llevel', exog=X_post)
mod1.simulate(f_model.params, len(X_post))
但这导致模拟似乎无法跟踪 X_post
预测的 predicted_mean
作为 exog。这是一个例子:
虽然 y_post
在 100 左右徘徊,但模拟结果为 -400。这种方法总是导致 p_value 为 50%。
所以当我尝试使用 initial_sate=0
和随机冲击时,结果如下:
现在看来,模拟遵循了预测平均值及其 95% 可信区间(正如 cfulton 在下面评论的那样,这实际上是一种错误的方法,而且它正在取代训练模型的水平方差)。
我尝试使用这种方法只是为了看看我会观察到什么 p 值。以下是我计算 p 值的方法:
samples = 1000
r = 0
y_post_sum = y_post.sum()
for _ in range(samples):
sim = mod1.simulate(f_model.params, len(X_post), initial_state=0, state_shocks=np.random.normal(size=len(X_post)))
r += sim.sum() >= y_post_sum
print(r / samples)
对于上下文,这是 Causal Impact谷歌开发的模型。由于它已在 R 中实现,我们一直在尝试使用 statsmodels
作为处理时间序列的核心来复制 Python 中的实现。
我们已经有了一个非常酷的 WIP implementation但是我们仍然需要 p 值来知道实际上我们什么时候产生了不能仅仅用随机性解释的影响(模拟系列并计算总和超过 y_post.sum()
的方法) > 也在 Google 的模型中实现)。
在我的示例中,我使用了 y[70:]
+= 10。如果我只添加一个而不是十个,Google 的 p 值计算将返回 0.001
(有一个y
中的影响),而在 Python 的方法中它返回 0.247(无影响)。
只有当我将 +5 添加到 y_post
时,模型返回的 p_value 为 0.02,因为它低于 0.05,我们认为对 y_post
有影响。
我正在使用 python3,statsmodels 版本 0.9.0
[EDIT2]
阅读 cfulton 的评论后,我决定全面调试代码以查看发生了什么。这是我发现的:
当我们创建类型为 UnobservedComponents
的对象时,卡尔曼滤波器的表示最终会启动。默认情况下,它 receives the parameter initial_variance
作为 1e6 设置 same property对象的。
当我们运行simulate
方法时,initial_state_cov
值is created使用相同的值:
initial_state_cov = (
np.eye(self.k_states, dtype=self.ssm.transition.dtype) *
self.ssm.initial_variance
)
最后,这个相同的值用于查找 initial_state :
initial_state = np.random.multivariate_normal(
self._initial_state, self._initial_state_cov)
这导致标准差为 1e6 的正态分布。
然后我尝试运行以下命令:
mod1 = UnobservedComponents(np.zeros(len(X_post)), level='llevel', exog=X_post, initial_variance=1)
sim = mod1.simulate(f_model.params, len(X_post))
plt.plot(sim, label='simul')
plt.plot(y_post, label='y')
plt.legend();
print(sim.sum() > y_post.sum())
结果是:
然后我测试了 p 值,最后在 y_post
中测试了 +1 的变化,模型现在可以正确识别添加的信号。
不过,当我使用与 R 的 Google 包中相同的数据进行测试时,p 值仍然存在偏差。也许需要进一步调整输入以提高其准确性。
最佳答案
@Josef 是正确的,你做了正确的事情:
mod1 = UnobservedComponents(np.zeros(y_post), 'llevel', exog=X_post)
mod1.simulate(f_model.params, len(X_post))
simulate
方法根据问题模型模拟数据,这就是为什么当你有外生变量时不能直接使用 trained_model
来模拟。
But for some reason the simulations always ended up being lower than y_post.
我认为这应该是预料之中的 - 运行您的示例并查看估计的系数,我们得到:
coef std err z P>|z| [0.025 0.975]------------------------------------------------------------------------------------sigma2.irregular 0.9278 0.194 4.794 0.000 0.548 1.307sigma2.level 0.0021 0.008 0.270 0.787 -0.013 0.018beta.x1 1.1882 0.058 20.347 0.000 1.074 1.303
The variance of the level is very small, which means that it is extremely unlikely that the level would shift upwards by nearly 10 percent in a single period, based on the model you specified.
When you used:
mod1.simulate(f_model.params, len(X_post), initial_state=0, state_shocks=np.random.normal(size=len(X_post))
发生的事情是水平项是这里唯一未观察到的状态,并且通过提供您自己的方差等于 1 的冲击,您基本上覆盖了模型实际估计的水平方差。 我不认为将初始状态设置为 0 在这里有很大的影响。(参见编辑)。
你写:
the p-value computation was closer, but still is not correct.
我不确定这意味着什么 - 为什么您会期望模型认为这种跳跃很可能发生?您期望达到什么 p 值?
编辑:
感谢您进一步调查(在编辑 2 中)。首先,我认为你应该做的是:
mod1 = UnobservedComponents(np.zeros(y_post), 'llevel', exog=X_post)
initial_state = np.random.multivariate_normal(
f_model.predicted_state[..., -1], f_model.predicted_state_cov[..., -1])
mod1.simulate(f_model.params, len(X_post), initial_state=initial_state)
现在,解释:
在 Statsmodels 0.9 中,我们还没有对具有扩散初始化的状态进行精确处理(不过从那时起它就被合并了,这是我在测试之前无法复制你的结果的原因之一您使用 0.9 代码库的示例)。这些“初始扩散”状态没有我们可以解决的长期均值(例如随机游走过程),而局部级别情况下的状态就是这样的状态。
“近似”漫射初始化涉及将初始状态均值设置为零,将初始状态方差设置为一个大数(如您所见)。
对于模拟,默认情况下,初始状态是从给定的初始状态分布中采样的。由于此模型是使用近似扩散初始化进行初始化的,这就解释了为什么您的过程是围绕某个随机数进行初始化的。
您的解决方案是一个很好的补丁,但它不是最优的,因为它没有将模拟期间的初始状态基于估计模型/数据的最后状态。这些值由 f_model.predicted_state[..., -1]
和 f_model.predicted_state_cov[..., -1]
给出。
关于python - 使用未观察到的组件模型模拟时间序列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51881148/
可不可以命名为MVVM模型?因为View通过查看模型数据。 View 是否应该只与 ViewModelData 交互?我确实在某处读到正确的 MVVM 模型应该在 ViewModel 而不是 Mode
我正在阅读有关设计模式的文章,虽然作者们都认为观察者模式很酷,但在设计方面,每个人都在谈论 MVC。 我有点困惑,MVC 图不是循环的,代码流具有闭合拓扑不是很自然吗?为什么没有人谈论这种模式: mo
我正在开发一个 Sticky Notes 项目并在 WPF 中做 UI,显然将 MVVM 作为我的架构设计选择。我正在重新考虑我的模型、 View 和 View 模型应该是什么。 我有一个名为 Not
不要混淆:How can I convert List to Hashtable in C#? 我有一个模型列表,我想将它们组织成一个哈希表,以枚举作为键,模型列表(具有枚举的值)作为值。 publi
我只是花了一些时间阅读这些术语(我不经常使用它们,因为我们没有任何 MVC 应用程序,我通常只说“模型”),但我觉得根据上下文,这些意味着不同的东西: 实体 这很简单,它是数据库中的一行: 2) In
我想知道你们中是否有人知道一些很好的教程来解释大型应用程序的 MVVM。我发现关于 MVVM 的每个教程都只是基础知识解释(如何实现模型、 View 模型和 View ),但我对在应用程序页面之间传递
我想realm.delete() 我的 Realm 中除了一个模型之外的所有模型。有什么办法可以不列出所有这些吗? 也许是一种遍历 Realm 中当前存在的所有类型的方法? 最佳答案 您可以从您的 R
我正在尝试使用 alias 指令模拟一个 Eloquent 模型,如下所示: $transporter = \Mockery::mock('alias:' . Transporter::class)
我正在使用 stargazer 创建我的 plm 汇总表。 library(plm) library(pglm) data("Unions", package = "pglm") anb1 <- pl
我读了几篇与 ASP.NET 分层架构相关的文章和问题,但是读得太多后我有点困惑。 UI 层是在 ASP.NET MVC 中开发的,对于数据访问,我在项目中使用 EF。 我想通过一个例子来描述我的问题
我收到此消息错误: Inceptionv3.mlmodel: unable to read document 我下载了最新版本的 xcode。 9.4 版测试版 (9Q1004a) 最佳答案 您没有
(同样,一个 MVC 验证问题。我知道,我知道......) 我想使用 AutoMapper ( http://automapper.codeplex.com/ ) 来验证我的创建 View 中不在我
需要澄清一件事,现在我正在处理一个流程,其中我有两个 View 模型,一个依赖于另一个 View 模型,为了处理这件事,我尝试在我的基本 Activity 中注入(inject)两个 View 模型,
如果 WPF MVVM 应该没有代码,为什么在使用 ICommand 时,是否需要在 Window.xaml.cs 代码中实例化 DataContext 属性?我已经并排观看并关注了 YouTube
当我第一次听说 ASP.NET MVC 时,我认为这意味着应用程序由三个部分组成:模型、 View 和 Controller 。 然后我读到 NerdDinner并学习了存储库和 View 模型的方法
Platform : ubuntu 16.04 Python version: 3.5.2 mmdnn version : 0.2.5 Source framework with version :
我正在学习本教程:https://www.raywenderlich.com/160728/object-oriented-programming-swift ...并尝试对代码进行一些个人调整,看看
我正试图围绕 AngularJS。我很喜欢它,但一个核心概念似乎在逃避我——模型在哪里? 例如,如果我有一个显示多个交易列表的应用程序。一个列表向服务器查询匹配某些条件的分页事务集,另一个列表使用不同
我在为某个应用程序找出最佳方法时遇到了麻烦。我不太习惯取代旧 TLA(三层架构)的新架构,所以这就是我的来源。 在为我的应用程序(POCO 类,对吧??)设计模型和 DAL 时,我有以下疑问: 我的模
我有两个模型:Person 和 Department。每个人可以在一个部门工作。部门可以由多人管理。我不确定如何在 Django 模型中构建这种关系。 这是我不成功的尝试之一 [models.py]:
我是一名优秀的程序员,十分优秀!