gpt4 book ai didi

python - 将文件名添加到数据框中的列标题

转载 作者:行者123 更新时间:2023-12-04 20:24:36 24 4
gpt4 key购买 nike

我有一个数据框,它是通过合并来自 7 个不同的 excel 文件的一列而创建的。以下是我使用的代码:

import pandas as pd
import glob

my_excel_files = glob.glob(r"C:\Users\.........\*.xlsx")

total_dataframe = pd.DataFrame()

for file in my_excel_files:
new_df = df['Comments']
total_dataframe = pd.concat([total_dataframe, new_df], axis=1) # Puts together all Comments columns
正如您从代码中看到的那样,我从每个 excel 中获取“注释”列并将它们放在一个新的 df 中,唯一的问题是我希望能够将文件名添加到列名中,这样我就知道哪一列来自哪个excel文件,现在所有这些文件都被称为“评论”。所以理想情况下,列标题之一是“评论(first_response.xlsx)”

最佳答案

让我们使用 pathlibpd.concat使用 dict 理解,我们可以获取 .name来自 pathlib 对象的属性以及使用 concat 时文件名将被设置为索引。

from pathlib import Path


dfs = pd.concat({f.name : pd.read_excel(f) for f in Path(r'C:\Users\..').glob('*.xlsx')})
这将使用文件名创建一个索引,您可以 reset_index如果你想把它作为一个列。

关于python - 将文件名添加到数据框中的列标题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63302313/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com