gpt4 book ai didi

python - Pandas UnicodeEncodeError : 'charmap' codec can't encode character

转载 作者:行者123 更新时间:2023-12-01 08:45:47 27 4
gpt4 key购买 nike

使用 pandas 并每次使用“特殊”字符,例如:é出现它会抛出编码错误。这是我的代码:

import pandas as pd


df = pd.read_csv(r'movies analysis\movie_metadata.csv',encoding='utf-8')
print(df.loc[df['title_year'] == 2015])

这是我收到的错误:

 File "D:\ANACONDA\lib\encodings\cp1255.py", line 19, in encode
return codecs.charmap_encode(input,self.errors,encoding_table)[0]
UnicodeEncodeError: 'charmap' codec can't encode character '\xe9' in position 645: character maps to <undefined>

关于这个主题有很多线程,但没有一个提供适合我的解决方案。

最佳答案

我最终所做的是将所有字符“规范化”为ascii。这并不理想,但对我有用:

import unicodedata
unicodedata.normalize('NFD', Data_U_Want_To_Normalize).encode('ascii', 'ignore')

因此,对于像 é 这样的字母,它会变成 e

关于python - Pandas UnicodeEncodeError : 'charmap' codec can't encode character,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53307384/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com