python - Pandas:计算 Z 分数以避免 "look ahead"偏差-6ren

python - Pandas:计算 Z 分数以避免 "look ahead"偏差

转载作者：太空宇宙更新时间：2023-11-03 19:44:19

27

4

我在名为“df”的数据框中有时间序列数据，并且计算 z 分数的代码如下:

mean = df.mean()
standard_dev = df.std()
z_score = (df - mean) / standard_dev

我想使用相应的观察结果和记录观察结果时已知的数据来计算每个观察结果的 z 分数。即我不想使用标准差和均值来合并特定时间点之后发生的数据。我只想使用时间 t、t-1、t-2....

的数据

我该怎么做？

最佳答案

使用 .expanding() - col 是您想要计算统计信息的列(如果出现以下情况，请删除 [col]您希望计算整个数据框):

您可能需要首先按时间列对值进行排序 - 表示为 time_col(以防尚未排序):

df=df.sort_values("time_col", axis=0)

然后:

df[col].sub(df[col].expanding().mean()).div(df[col].expanding().std())

引用: https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.expanding.html

对于示例数据:

import pandas as pd

df=pd.DataFrame({"a": list("xyzpqrstuv"), "b": [6,5,7,1,-9,0,3,5,2,8]})

df["c"]=df["b"].sub(df["b"].expanding().mean()).div(df["b"].expanding().std())

输出:

   a  b         c
0  x  6       NaN
1  y  5 -0.707107
2  z  7  1.000000
3  p  1 -1.425880
4  q -9 -1.677484
5  r  0 -0.281450
6  s  3  0.210502
7  t  5  0.534207
8  u  2 -0.046142
9  v  8  1.062430

关于python - Pandas:计算 Z 分数以避免 "look ahead"偏差，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/60238203/

27

4

0

文章推荐： matlab - 如何在 MATLAB 中检索选定的文本？

文章推荐： python - Django - 提交联系表单时出现 405 错误

c - 避免蒙特卡罗模拟中的基本 rand() 偏差？
我正在用 Objective C 重写蒙特卡罗模拟，以便在 VBA/Excel 的 dll 中使用。计算中的“引擎”是创建 0 到 10001 之间的随机数，并将其与 5000-7000 附近的变量进
python - Tensorflow - 训练后检索训练后的前馈神经网络的权重/偏差
我目前正在尝试使用 Flask 创建一个简单的 Web 应用程序，用于交互式神经网络训练。我正在努力解决的是在训练前馈神经网络后检索隐藏层的权重 - 我的目标是为 Tensorflow's Playg
iphone - CLLocation - 在另一个位置查找磁偏角/偏差
我知道如何找到手机当前所在位置的真实航向/磁航向，但是否有可能找到远程位置的磁偏差/磁偏角？我想做的是能够在 map 上的一个地方放置一个图钉，然后找到真实的方位角和从该点开始有磁差的方位角。谢谢
java - OpenGL 纹理中的 LOD 偏差
函数方法glTexImage2D将“level”作为参数，表示细节级别偏差。但是，可以使用 glTexParameteri 和 GL_TEXTURE_LOD_BIAS 目标来设置纹理的 LOD 偏差。
python - 显示每个节点的 Neurolabs 权重/偏差？
有没有一种简单的方法来显示我在训练后输入到使用 Neurolab 开发的 ANN 中的每个属性的偏差或权重？最佳答案是的，您可以看到所有图层的权重和偏差。通过使用 net.layers[i].np
ios - 如何在 Metal 中指定 LOD 偏差？
我正在用我目前在 Metal 中使用的应用程序的 Android 版本重写一个 OpenGL 过滤器。它使用以下纹理查找函数:vec4 texture2D(sampler2D 采样器，vec2 坐标，
java - 当鼠标以小速度瞄准时，如何避免 int-floor 偏差？
我有一个简单的算法，可以让对象在 Java 中以给定的最大速度跟随鼠标指针。该算法的关键在于: // Set up displacement trackers for later. // (These
android - android lollipop字体 "HelveticaNeue.ttf"偏差
我在我的 Android 应用程序中使用“HelveticaNeue.ttf”作为自定义字体；对于所有以前的 android 版本都很好，但是对于 lollipop，它比通常的字体拉伸(stretch
c++ - 生成一组大小为 N 的整数的最佳方法，分布像正态分布，给定均值和标准差。偏差
我正在寻找一种方法来生成一组具有指定均值和标准差的整数。偏差。使用随机库，可以生成一组以高斯方式分布的随机 double ，这看起来像这样: #include std::tr1::normal_d
r - 在 gbm 的 LamdbaMART 实现中的验证集上获得 0 偏差
我正在尝试训练 LambdaMART 模型来对对象列表执行成对排序。我的训练数据集由 50,000 个 112 维特征向量组成。每个特征都由一个非负整数编码。目标值是正整数(不连续)。给定两个新实例
python - Pandas:计算 Z 分数以避免 "look ahead"偏差
我在名为“df”的数据框中有时间序列数据，并且计算 z 分数的代码如下: mean = df.mean() standard_dev = df.std() z_score = (df - mean)
python - Pytorch - 如何提取 MLP 网络的特征(权重、偏差、节点数、隐藏层)？
关闭。此题需要details or clarity 。目前不接受答案。想要改进这个问题吗？通过 editing this post 添加详细信息并澄清问题. 已关闭 3 年前。 Improve th
python - TensorFlow 线性回归 - 返回 NaN 表示权重、偏差，返回 Inf 表示损失
我正在尝试在 TensorFlow 中执行以下线性回归，但我的输出都是 Inf 和 NaN。我的输入数据集必须是 Y=0.5*X + 2 + 噪声；其中 X 是大小 (1000) 的正态分布，噪声是

首页

博学

6Ren·AI

商城

python - Pandas:计算 Z 分数以避免 "look ahead"偏差