gpt4 book ai didi

python - 如何将一个 csv 文件中的列附加到第二个 csv(具有不同索引)

转载 作者:行者123 更新时间:2023-12-04 17:35:41 24 4
gpt4 key购买 nike

我正在努力将许多 csv 文件连接在一起,并希望从多列 csv 中取出一列,并将其作为新列附加到第二个 csv 中。问题是列的行数不同,因此一旦达到现有 csv 的行索引,我添加到现有 csv 的新列就会被缩短。

我尝试将新列作为第二个数据框读取,然后将该数据框作为新列添加到现有的 csv 中。

df = pd.read_csv("Existing CSV.csv")
df2 = pd.read_csv("New CSV.csv", usecols = ['Desired Column'])
df["New CSV"] = df2

“现有 CSV”有 1200 行数据,而“新 CSV”有 1500 行。当我运行代码时,“新 CSV”列被添加到“现有 CSV”中,但是,仅包含前 1200 行数据。

理想情况下,“新 CSV”中的所有 1500 行都将包括在内,“现有 CSV”中缺少的 300 行将留空。

最佳答案

默认情况下,read_csv 为生成的 DataFrame 提供一个整数索引,因此我可以想出几个选项来尝试。

设置

df = pd.read_csv("Existing CSV.csv")
df2 = pd.read_csv("New CSV.csv", usecols = ['Desired Column'])

方法一:加入

df = df.join(df2['Desired Column'], how='right')

方法二:reindex_likeassign

df = df.reindex_like(df2).assign(**{'Desired Column': df2['Desired Column']})

关于python - 如何将一个 csv 文件中的列附加到第二个 csv(具有不同索引),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56763245/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com