gpt4 book ai didi

python - 添加具有部分重叠索引的 DataFrame

转载 作者:行者123 更新时间:2023-12-02 18:18:02 32 4
gpt4 key购买 nike

我想将两个 Pandas DataFrame 添加在一起,其中包含一个日期时间索引和一组公共(public)列。

日期时间索引将具有 95% 的共同值,但 df2 中的某些行可能不在 df1 中反之亦然。

我想将两个 DataFrame 添加在一起,当其中一个 DataFrame 没有索引时,另一个 DataFrame 只会将其视为 0 (或取具有值的那个,以更好者为准)。

结果应该删除任何索引,即类似于外部连接的东西,而不是内部连接。

我已经尝试过pd.add ,但这似乎下降了 NaN结果两个 DataFrame 都没有条目。

pd.concat在它们没有共同索引的地方工作,但在有共同索引的地方我得到重复而不是相加。我需要再做一次groupby总和步骤?我认为有一种更简单的方法可以做到这一点。

例如:

框架 1

<表类=“s-表”><标题>月瓦尔1瓦尔2 <正文>2022-01-01122022-02-01342022-03-0156

框架 2

<表类=“s-表”><标题>月瓦尔1瓦尔2 <正文>2022-03-011011022022-04-011031042024-01-011051062025-01-01107108

期望的结果

<表类=“s-表”><标题>月瓦尔1瓦尔2 <正文>2022-01-01122022-02-01342022-03-011061082022-04-011031042024-01-011051062025-01-01107108

最佳答案

希望这对你有用:)

pd.concat([df1,df2]).groupby(["Month"]).sum().reset_index()

输出

    Month   Val1    Val2
0 2022-01-01 1 2
1 2022-02-01 3 4
2 2022-03-01 106 108
3 2022-04-01 103 104
4 2024-01-01 105 106
5 2025-01-01 107 108

关于python - 添加具有部分重叠索引的 DataFrame,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/71279545/

32 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com