gpt4 book ai didi

python - 由 ascii 忽略编码的 pandas csv 写入

转载 作者:太空宇宙 更新时间:2023-11-04 06:03:56 41 4
gpt4 key购买 nike

Pandas csv 解析器(http://pandas.pydata.org/pandas-docs/stable/generated/pandas.io.parsers.read_csv.html)支持不同的编码:

import pandas
data = pandas.read_csv(myfile, encoding='utf-8', quotechar='"', delimiter=',')

如何实现 ascii 忽略我的数据帧的编码大小写?

encode('ascii', 'ignore')

最佳答案

Pandas 似乎不允许您这样做。在使用 pandas 阅读之前,我必须预处理我的 CSV 文件:

decoded = codecs.decode(myfile.read(), "utf-8", "ignore")
encoded = codecs.encode(decoded, "utf-8", "ignore") #probably superfluous
fakefile = StringIO.StringIO(encoded)
data = pandas.read_csv(fakefile, encoding="utf-8")

如果你有一个非常大的 CSV 文件可能会很糟糕,但你可以一次读取 csv 文件的 block 。

关于python - 由 ascii 忽略编码的 pandas csv 写入,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23248725/

41 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com