gpt4 book ai didi

python - 使用 Pandas 组合/合并 2 个不同的 Excel 文件/工作表

转载 作者:太空狗 更新时间:2023-10-29 18:24:22 27 4
gpt4 key购买 nike

我正在尝试合并 2 个不同的 Excel 文件。 (感谢帖子 Import multiple excel files into python pandas and concatenate them into one dataframe )

目前我做的是:

import os
import pandas as pd

df = pd.DataFrame()

for f in ['c:\\file1.xls', 'c:\\ file2.xls']:
data = pd.read_excel(f, 'Sheet1')
df = df.append(data)

df.to_excel("c:\\all.xls")

这是它们的样子。

enter image description here

但是我想:

  1. 排除每个文件的最后一行(即 File1.xls 中的第 4 行和第 5 行;File2.xls 中的第 7 行和第 8 行)。
  2. 添加一列(或覆盖 A 列)以指示数据的来源。

例如:

enter image description here

这可能吗?谢谢。

最佳答案

对于数量。 1、可以指定skip_footer 说明here ;或者,或者,做

data = data.iloc[:-2]

一旦您读取了数据。

对于数量。 2、你可以这样做:

from os.path import basename
data.index = [basename(f)] * len(data)

另外,也许最好将所有数据帧放在一个列表中,然后在最后concat它们;像这样的东西:

df = []
for f in ['c:\\file1.xls', 'c:\\ file2.xls']:
data = pd.read_excel(f, 'Sheet1').iloc[:-2]
data.index = [os.path.basename(f)] * len(data)
df.append(data)

df = pd.concat(df)

关于python - 使用 Pandas 组合/合并 2 个不同的 Excel 文件/工作表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25400240/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com