gpt4 book ai didi

python pandas read_excel 在 describe() 上返回 UnicodeDecodeError

转载 作者:太空狗 更新时间:2023-10-30 01:14:24 25 4
gpt4 key购买 nike

我喜欢 pandas,但我遇到了 Unicode 错误的实际问题。 read_excel() 返回可怕的 Unicode 错误:

import pandas as pd
df=pd.read_excel('tmp.xlsx',encoding='utf-8')
df.describe()

---------------------------------------------------------------------------
UnicodeDecodeError Traceback (most recent call last)
...
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc2 in position 259: ordinal not in range(128)

我发现原始 Excel 在许多单元格的末尾都有(不间断空格),可能是为了避免将长数字字符串转换为 float 。

解决这个问题的一种方法是剥离细胞,但必须有更好的方法。

for col in df.columns:
df[col]=df[col].str.strip()

我用的是anaconda2.2.0 win64,pandas 0.16

最佳答案

建议试试这个方法here :

df=pd.read_excel('tmp.xlsx',encoding=sys.getfilesystemencoding())

关于python pandas read_excel 在 describe() 上返回 UnicodeDecodeError,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30765820/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com