gpt4 book ai didi

Python Pandas 数据框减去累积列

转载 作者:行者123 更新时间:2023-11-28 21:07:58 25 4
gpt4 key购买 nike

我有一些数据要导入到 Pandas 数据框中。此数据是“累积的”并按时间序列编制索引,请参见下文:

                        Raw data
2016-11-23 10:00:00 48.6
2016-11-23 11:00:00 158.7
2016-11-23 12:00:00 377.8
2016-11-23 13:00:00 591.7
2016-11-23 14:00:00 748.5
2016-11-23 15:00:00 848.2

数据每天更新,所以时间序列每天都会向前移动一天。

我需要做的是获取此数据框并创建一个新列,如下所示。第一行只是复制“原始数据”列中的数据。然后每个后续行都从“原始数据”列中获取数据,并减去出现在它之前的值,例如158.7 - 48.6 = 110.1, 377.8 - 158.7 = 219.1, 等等

有谁知道如何在 Python/Pandas 中实现“处理数据”列中的内容?

                    Raw data    Processed data
23/11/2016 10:00 48.6 48.6
23/11/2016 11:00 158.7 110.1
23/11/2016 12:00 377.8 219.1
23/11/2016 13:00 591.7 213.9
23/11/2016 14:00 748.5 156.8
23/11/2016 15:00 848.2 99.7

最佳答案

您可以使用减去 subshift编辑专栏:

最后用原始数据中的第一个值填充NaN

df['Processed data'] = df['Raw data'].sub(df['Raw data'].shift())
df['Processed data'].iloc[0] = df['Raw data'].iloc[0]
print (df)
Raw data Processed data
2016-11-23 10:00:00 48.6 48.6
2016-11-23 11:00:00 158.7 110.1
2016-11-23 12:00:00 377.8 219.1
2016-11-23 13:00:00 591.7 213.9
2016-11-23 14:00:00 748.5 156.8
2016-11-23 15:00:00 848.2 99.7

关于Python Pandas 数据框减去累积列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40786661/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com