gpt4 book ai didi

python - 在 IronPython 中使用编解码器读取 UTF-8 文件

转载 作者:太空狗 更新时间:2023-10-29 19:28:44 24 4
gpt4 key购买 nike

我有一个以 UTF-8 编码的 .csv 文件,其中包含拉丁符号和西里尔符号。

;F1;F2;abcdefg3;F200
;ABSOLUTE;NOMINAL;NOMINAL;NOMINAL
o1;1;USA;Новосибирск;1223

我正在尝试在 IronPython 2.7.1 中执行以下脚本:

import codecs

f = codecs.open(r"file.csv", "rb", "utf-8")
f.next()

在执行 f.next() 期间发生异常:

Traceback (most recent call last):
File "c:\Program Files\Microsoft Visual Studio 10.0\Common7\IDE\Extensions\Microsoft\Python Tools for Visual Studio\1.1\visualstudio_py_repl.py", line 492, in run_file_as_main
code.Execute(self.exec_mod)
File "<string>", line 4, in <module>
File "C:\Program Files\IronPython 2.7.1\Lib\codecs.py", line 684, in next
return self.reader.next()
File "C:\Program Files\IronPython 2.7.1\Lib\codecs.py", line 615, in next
line = self.readline()
File "C:\Program Files\IronPython 2.7.1\Lib\codecs.py", line 530, in readline
data = self.read(readsize, firstline=True)
File "C:\Program Files\IronPython 2.7.1\Lib\codecs.py", line 477, in read
newchars, decodedbytes = self.decode(data, self.errors)
UnicodeEncodeError: ('unknown', '\x00', 0, 1, '')

同时在 CPython 2.7 中脚本可以正常工作。同样在 IronPython 2.7.1 中,以下脚本工作正常:

import codecs

f = codecs.open(r"file.csv", "rb", "utf-8")
f.readlines()

有人知道是什么导致了这种奇怪的行为吗?

最佳答案

看起来这可能是 next() 处理编解码器的方式中的错误。可以吗open an issue附上要重现的文件?

关于python - 在 IronPython 中使用编解码器读取 UTF-8 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10123296/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com