gpt4 book ai didi

python - 如何阅读 Excel 工作簿( Pandas )

转载 作者:行者123 更新时间:2023-11-28 16:29:58 25 4
gpt4 key购买 nike

首先我想说我不是专家。我精通 Python,但背负着日程安排和学习 Python 的重担,就像我年轻时应该做的那样!

问题:
我有一本工作簿,有时会有多个工作表。在阅读工作簿时,我不会知道工作表的数量或工作表名称。每张纸上的数据排列都是相同的,有些列的名称为“未命名”。问题是我尝试或在网上找到的所有内容都使用 pandas.ExcelFile 来收集所有工作表,这很好,但我需要能够跳过 4 行,然后只读取 42 行并解析特定列。尽管工作表可能具有完全相同的结构,但列名可能相同或不同,但希望将它们合并。

这就是我所拥有的:

import pandas as pd
from openpyxl import load_workbook

# Load in the file location and name
cause_effect_file = r'C:\Users\Owner\Desktop\C&E Template.xlsx'

# Set up the ability to write dataframe to the same workbook
book = load_workbook(cause_effect_file)
writer = pd.ExcelWriter(cause_effect_file)
writer.book = book
writer.sheets = dict((ws.title, ws) for ws in book.worksheets)

# Get the file skip rows and parse columns needed
xl_file = pd.read_excel(cause_effect_file, skiprows=4, parse_cols = 'B:AJ', na_values=['NA'], convert_float=False)

# Loop through the sheets loading data in the dataframe
dfi = {sheet_name: xl_file.parse(sheet_name)
for sheet_name in xl_file.sheet_names}

# Remove columns labeled as un-named
for col in dfi:
if r'Unnamed' in col:
del dfi[col]

# Write dataframe to sheet so we can see what the data looks like
dfi.to_excel(writer, "PyDF", index=False)

# Save it back to the book
writer.save()

我正在使用的文件的链接如下 Excel File

最佳答案

尝试根据您的具体需要修改以下内容:

import os
import pandas as pd

df = pd.DataFrame()
xls = pd.ExcelFile(path)

然后遍历所有可用的数据表:

for x in range(0, len(xls.sheet_names)): 
a = xls.parse(x,header = 4, parse_cols = 'B:AJ')
a["Sheet Name"] = [xls.sheet_names[x]] * len(a)
df = df.append(a)

您可以调整标题行和列以阅读每张工作表。我添加了一列,用于指示该行来自数据表的名称。

关于python - 如何阅读 Excel 工作簿( Pandas ),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32976423/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com