gpt4 book ai didi

Python pandas excel输出不是决定形式

转载 作者:太空宇宙 更新时间:2023-11-03 21:42:42 25 4
gpt4 key购买 nike

我有一个包含 100 页的 Excel 文件。我需要从第 7 行开始的每个工作表 P 列中提取数据,并创建一个新文件,其中所有提取的数据都在同一列中。在我的输出文件中,数据位于不同的列中,即(工作表 2 的数据位于 R 列,工作表 3 的数据位于 B 列)

如何使新输出Excel中的数据位于同一列?谢谢。

ps。将所有工作表的 P 列数据合并到单个工作表中的单个列中对我来说就足够了

import pandas as pd
import os
Flat_Price = "Flat Pricing.xlsx"
dfs = pd.read_excel(Flat_Price, sheet_name=None, usecols = "P", skiprows=6, indexcol=1, sort=False)
df = pd.concat(dfs)
print(df)
writer = pd.ExcelWriter("Output.xlsx")
df.to_excel(writer, "Sheet1")
writer.save()
print (os.path.abspath("Output.xlsx"))

最佳答案

您需要参数 header=None 作为默认 0 列名称:

dfs = pd.read_excel(Flat_Price, 
sheet_name=None,
usecols = "P",
skiprows=6,
indexcol=1,
header=None)

然后可以从MultiIndex的第一级提取数字,转换为整数并按sort_index排序:

df =df.set_index([df.index.get_level_values(0).str.extract('(\d+)',expand=False).astype(int), 
df.index.get_level_values(1)]).sort_index()

关于Python pandas excel输出不是决定形式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52733542/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com