gpt4 book ai didi

python - pandas 将 2 个具有不同日期索引的数据帧组合在一起

转载 作者:行者123 更新时间:2023-11-30 23:24:09 24 4
gpt4 key购买 nike

假设我从两个单独的文件中提取了 csv 数据,其中包含 pandas 自动提取的日期索引,该索引是原始列之一。

import pandas as pd
df1 = pd.io.parsers.read_csv(data1, parse_dates = True, infer_datetime_format=True, index_col=0, names=['A'])
df2 = pd.io.parsers.read_csv(data2, parse_dates = True, infer_datetime_format=True, index_col=0, names=['A'])

现在,一个 csv 文件的日期与另一个不同,但是当使用 read_csv 加载时,日期已明确定义。我已经尝试过 join 命令,但它似乎没有保留日期。

df1 = df1.join(df2)

我得到了一个有效的数据框,但日期范围被固定为原始范围的某个较小子集,因为两个 csv 文件的日期之间存在差异。我想要的是一种创建具有 2 列(均为“A”列)的单个数据框的方法,其中包含自动填充的非重叠日期的 NaN 或零值。有没有一个简单的解决方案,或者我可能在这里遗漏了什么。非常感谢。

最佳答案

默认情况下,pandas DataFrame 方法“join”使用“内部”合并来组合两个数据帧。您想使用“外部”合并。您的连接行应为:

df1 = df1.join(df2, how='outer')

参见http://pandas.pydata.org/pandas-docs/version/0.13.1/generated/pandas.DataFrame.join.html

关于python - pandas 将 2 个具有不同日期索引的数据帧组合在一起,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23619253/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com