gpt4 book ai didi

python - pandas 读取顶行左列空白的 Excel 文件时出现问题

转载 作者:太空宇宙 更新时间:2023-11-03 16:04:06 33 4
gpt4 key购买 nike

我尝试读取如下所示的 Excel 文件, enter image description here

我像这样使用 Pandas

xls = pd.ExcelFile(file_path)
assets = xls.parse(sheetname="Sheet1", header=1, index_col=1)

但是我遇到了错误

ValueError: Expected 4 fields in line 3, saw 5

我也尝试过

assets = xls.parse(sheetname="Sheet1", header=1, index_col=1, parse_cols="B:E")

但是我得到了错误的结果,如下

enter image description here

然后尝试

assets = xls.parse(sheetname="Sheet1", header=1, index_col=0, parse_cols="B:E")

终于可以工作了,但是为什么index_col=0 和parse_cols=“B:E”?这让我很困惑,因为基于 pandas documents , assets = xls.parse(sheetname="Sheet1", header=1, index_col=1) 应该没问题。我错过了什么吗?

最佳答案

read_excel documentation有一点不清楚。

  • skiprows=1 跳过文件顶部的第一个空行,或者 header=1 也可以使用具有列索引的第二行。
  • parse_cols='B:E' 是一种跳过文件左侧第一个空列的方法
  • index_col=0 是可选的,允许将第一个解析列(本例中的 B)定义为 DataFrame 索引。错误就在这里,因为 index_col 与通过 parse_cols 参数选择的列相关。

在您的示例中,您可以使用以下代码

pd.read_excel('test.xls', sheetname='Sheet1', skiprows=1, 
parse_cols='B:E', index_col=0)

# AA BB CC
# 10/13/16 1 12 -1
# 10/14/16 3 12 -2
# 10/15/16 5 12 -3
# 10/16/16 3 12 -4
# 10/17/16 5 23 -5

关于python - pandas 读取顶行左列空白的 Excel 文件时出现问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40026020/

33 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com