gpt4 book ai didi

python - 寻找数据框中事件之间的差异

转载 作者:太空宇宙 更新时间:2023-11-04 01:47:11 25 4
gpt4 key购买 nike

我有一个像这样的数据框(真实的是 700 万条记录和 345 个特征)下图只是与客户在一个月内进行操作相关的一小部分。我想要做的是在末尾创建一个列,其中包含每个操作之间的平均差。例如在第一条记录中 平均差(可能)为 3

当我说平均差异就像 op1 和 op4 之间的距离为 3,然后 op4 和 op11 之间的差异为 7,然后 op11 和 op15 之间的差异为 3,依此类推。因此,如果我们将所有值相加,我们将 13 分为总操作,即 op1、op4、op11、op15(4 个操作),我们得到 3.25。这就是我所说的平均差异。

enter image description here

最佳答案

  • numpy.flatnonzero:识别非零值的位置
  • numpy.diff:查找相邻值之间的差异。当从 flatnonzero 传递结果时,它会发现位置之间的差异
  • numpy.mean:求平均值

生成一个新列'MD',其中包含非零值之间的平均位置距离

df.assign(MD=[np.diff(np.flatnonzero(a)).mean() for a in df.to_numpy()])

关于python - 寻找数据框中事件之间的差异,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58842196/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com