gpt4 book ai didi

excel - Pandas 可以根据值而不是行隐式确定标题吗?

转载 作者:行者123 更新时间:2023-12-04 20:37:47 25 4
gpt4 key购买 nike

我与使用 Excel 并不断添加或减去我不知道的行的人一起工作。我必须抓取一个文档以获取数据,并且找到标题的行会根据情绪而变化。

我的挑战是通过检测头部的位置来处理这些振荡电流。

我首先使用 xlrd 组织了我的抓取。以及一些使用工作簿中的值的条件语句。

我最初的尝试很有效并且很长(所以我不会发布它),但涉及引入整张纸,而不是切片:

from xlrd import open_workbook

book = open_workbook(fName)
sheet = book.sheet_by_name(sht)

return book,sheet

但是,它很大,我希望获得更有针对性的选择。标题值永远不会改变,当数据显示在该行之后时也不会改变。

您是否知道使用 pandas.ExcelFile 根据工作表中找到的值隐式获取标题的方法?或 pandas.read_excel ?

这是我对 pandas.ExcelFile 的尝试:
import pandas as pd

xlsx = pd.ExcelFile(fName)
dataFrame = pd.read_excel(xlsx, sht,
parse_cols=21, merge_cells=noMerge,
header=header)

return dataFrame

除非我为调用提供正确的 header 值,否则我无法让代码工作,这正是我希望避免的。

这个 previous question似乎提出了类似的问题,但没有解决隐式查找标题的问题。

最佳答案

通过 ExcelFile 对象执行相同的循环:

xlsx = pd.ExcelFile(fName)
sheet = xlsx.sheet_by_name(sht)
# apply the same algorithm you wrote against xlrd here
# ... results in having header_row = something, 0 based
dataFrame = pd.read_excel(xlsx, sht,
parse_cols=21, merge_cells=noMerge,
skip_rows=header_row)

关于excel - Pandas 可以根据值而不是行隐式确定标题吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39454799/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com