gpt4 book ai didi

python - 沿着时间序列索引连接 pandas 数据帧而不重复列

转载 作者:行者123 更新时间:2023-12-01 05:13:45 24 4
gpt4 key购买 nike

我想连接 2 个 pandas DataFrame,每个数据帧的时间序列索引可能重叠,而且列键也可能重叠。

例如:

    old_close                                   new_close
1TM ABL ... ABL ANG ...
Date Date
2009-06-05 100 564 1990-06-08 120 2533
2009-06-04 102 585 1990-06-05 121 2531
2009-06-03 101 532 1990-06-04 123 2520
2009-06-02 99 540 1990-06-03 122 2519
2009-06-01 99 542 1990-06-02 121 2521
...

我想合并 old_close 和 new_close 以形成一个新的 DataFrame,其中包含两个 DataFrame 中的所有数据,但排除两个索引上的所有重复值。

到目前为止我这样做:

merged_close = pd.concat([old_close, new_close], axis=1)

但这会导致重复的列(沿轴 0 时的行)和 MultiIndex。

最佳答案

假设您想要“排除两个索引上的所有重复值”,这应该可行

unique_indices = np.setdiff1d(np.unioin1d(old_close.index.to_list(), new_close.index.to_list()), 
np.intersect1d(old_close.index.to_list(), new_close.index.to_list()))
merged_close = pd.concat([old_close, new_close]).ix[unique_indices]

编辑:更新了唯一索引计算。现在所有重复的索引都被删除

关于python - 沿着时间序列索引连接 pandas 数据帧而不重复列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23630380/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com