gpt4 book ai didi

excel - 由于数字格式为文本,将 Excel 文件读取到 Python 失败

转载 作者:行者123 更新时间:2023-12-02 19:11:55 31 4
gpt4 key购买 nike

我有大量 Excel 文件,每个文件都有一列,其中数字被格式化为文本。 Excel 给出错误“此单元格中的数字格式为文本或前面带有撇号” - 请参阅第三列,其中单元格有一个绿色三角形。

enter image description here

我的目标是在 Pandas 中打开所有这些文件而无需手动打开每个文件并将列转换为数字。但是,pd.read_excel() 失败并出现以下 xlrd 错误:

XLRDError: ZIP file contents not a known type of workbook

不出所料,当我直接使用 xlrd 时:wb = xlrd.open_workbook(filename) 我得到了同样的错误。

我还尝试了 openpyxl: wb = openpyxl.load_workbook(filename),它给了我这个:

KeyError: "There is no item named 'xl/_rels/workbook.xml.rels' in the archive"

我确认,如果我在 Excel 中手动将列转换为数字并重新保存工作簿,则 pandas (xlrd) 和 openpyxl 都可以打开该文件。

有人有什么想法吗?

最佳答案

读取 Excel 时使用“转换器”。
Docs

例如:

df = pd.read_excel('yourfile.xlsx',sheetname='sheetname',header=0,converters={ "% Chg" : str })

关于excel - 由于数字格式为文本,将 Excel 文件读取到 Python 失败,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48156915/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com