python - 在 IronPython 中使用编解码器读取 UTF-8 文件-6ren

python - 在 IronPython 中使用编解码器读取 UTF-8 文件

转载作者：太空狗更新时间：2023-10-29 19:28:44

24

4

我有一个以 UTF-8 编码的 .csv 文件，其中包含拉丁符号和西里尔符号。

;F1;F2;abcdefg3;F200
;ABSOLUTE;NOMINAL;NOMINAL;NOMINAL
o1;1;USA;Новосибирск;1223

我正在尝试在 IronPython 2.7.1 中执行以下脚本:

import codecs

f = codecs.open(r"file.csv", "rb", "utf-8")
f.next()

在执行 f.next() 期间发生异常:

Traceback (most recent call last):
  File "c:\Program Files\Microsoft Visual Studio 10.0\Common7\IDE\Extensions\Microsoft\Python Tools for Visual Studio\1.1\visualstudio_py_repl.py", line 492, in run_file_as_main
    code.Execute(self.exec_mod)
  File "<string>", line 4, in <module>
  File "C:\Program Files\IronPython 2.7.1\Lib\codecs.py", line 684, in next
    return self.reader.next()
  File "C:\Program Files\IronPython 2.7.1\Lib\codecs.py", line 615, in next
    line = self.readline()
  File "C:\Program Files\IronPython 2.7.1\Lib\codecs.py", line 530, in readline
    data = self.read(readsize, firstline=True)
  File "C:\Program Files\IronPython 2.7.1\Lib\codecs.py", line 477, in read
    newchars, decodedbytes = self.decode(data, self.errors)
UnicodeEncodeError: ('unknown', '\x00', 0, 1, '')

同时在 CPython 2.7 中脚本可以正常工作。同样在 IronPython 2.7.1 中，以下脚本工作正常:

import codecs

f = codecs.open(r"file.csv", "rb", "utf-8")
f.readlines()

有人知道是什么导致了这种奇怪的行为吗？

最佳答案

看起来这可能是 next() 处理编解码器的方式中的错误。可以吗open an issue附上要重现的文件？

关于python - 在 IronPython 中使用编解码器读取 UTF-8 文件，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/10123296/

24

4

0

文章推荐： angular - 'WeakMap' 的所有声明必须具有相同的类型参数

文章推荐： python - Flask中的路径路由

文章推荐： python - Eventlet/通用异步 I/O 任务粒度

文章推荐： python - 如何将行号从 Python traceback 发送到 vim？

Dart JSON 解码器
令我惊讶的是，dart 没有内置的对象到 json 和 json 到对象的映射器。我读到我们必须自己手动编写映射代码，这并不令人愉快。无论如何，虽然我没有针对我的用例对其进行彻底测试，但我发现了
java - 8位PCMU编码器/解码器
我有 16 位 PCM 音频，我想将其转换为 8 位 PCMU。据我所知，16 位到 8 位的转换很容易 - 只需从每个样本中删除最后 8 位即可。我想知道如何将8位pcm转换为8位pcmu？任何文
Java Jpeg 解码器
我的任务是使用动态霍夫曼修改 JPEG 格式。所以我试图找到用Java编写的简单Jpeg解码器的源代码。谁能帮我？最佳答案看看这个:http://www.dreamincode.net/forum
Java JSON 解码器
我收到错误代码(如下)，并且无法解码该字符串，我知道它正在查找 JSON 和我也保存的文件，但它无法解析。错误代码: Unexpected token VALUE(-10) at position 8
java - 随机编码器/解码器
我制作了这个程序，它是一个随 secret 码。 public class SaadAbdullahCipher { private char[] alphabet = {'a', 'b'
java - 如何创建编码器？解码器？
总的来说，我对编程还很陌生，我想知道如何对输入的文本进行编码/解码。对于 ex A -> D，所有字母必须减去 3 个字母B -> E等等我将输入一些伪代码作为示例: INPUT MESSAGE:
go - 获取字符集字符串的编码器/解码器
是否有内置函数或受支持的包中的函数来获取基于输入字符集字符串，例如 ISO-8859-1 或 ISO-8859-15？现在我看到的唯一方法是自己匹配它: func getEncoderForChars
JSON 解码器无法读取数据，因为它的格式不正确
我是新来的。不知何故，我能够理解如何做到这一点。我在下面做，但它给出了错误 - 无法读取数据，因为它的格式不正确。有人可以帮助我吗？从过去的 4 天开始，我一直坚持这一点。我真的很感激。 impor
json - 如何为复杂对象编写自定义 JSON 解码器？
就像标题所说，我正在尝试为一个我定义的类的对象编写一个自定义解码器，该对象包含我定义的类的其他对象。 “外部”类是一个 Edge，定义如下: class Edge: def __init__(
audio - 重新编码音频:gstreamer中的libav编码器/解码器
我想重新编码音频文件的音频流。以下gstreamer管道可以正常工作: gst-launch-1.0 filesrc location=input.flac ! decodebin ! audioco
Swift4 的 JSON 解码器
使用Swift4、iOS11.1、Xcode9.1，尝试匹配 Swift4 的可编码结构中的 JSON 文件，我遇到以下问题: 这是我的代码: struct Station: Codable {
java - WBXML 解析器/解码器
正如标题所示，我正在寻找遵循 1.3 版本的 Java(+Android) WBXML 解析器/解码器。如果有必要的话，我什至可以考虑调用 native 代码。谢谢。最佳答案我确实记得不久前我使用
java - 将架构位置添加到 JAXB 解码器
当 JABX 解码器尝试解码 xml 时，我遇到以下错误线程“main”中出现异常 javax.xml.bind.UnmarshalException - 带有链接异常:[org.xml.sax.S
python - Keras Conv2D 解码器
我正在处理不同尺寸(x，y)的图像。当在 MaxPooling2D 之后使用 UpSampling2D 时，它不能很好地重建它，因为 x-dim 不等于 y-dim。当 x=y (例如 28x28)时
javascript - 压缩 JS 解码器
http://www.lotterypost.com/js-compress.aspx 这个网站非常适合压缩 JS 但我想解码.... 除了在线之外，有没有最好的免费工具来编码/解码 Js 最佳答案
java - 不同的 Base64 解码器
我刚刚在验证 JWT 时遇到了问题。我正在运行的代码是一个相当肮脏的黑客，它采用 JWT 的第二个组件并通过 Base64 解码器运行它。然而事实证明，通过一些 super 特殊的 JWT，我得到了一
c++ - 将输出帧保存为图像文件 CUDA 解码器
我正在尝试使用 CUDA 解码器项目中的代码将解码后的图像文件保存回 BMP 图像。 if (g_bReadback && g_ReadbackSID)
c++ - FLV & F4V开源C++解码器
已关闭。此问题旨在寻求有关书籍、工具、软件库等的建议。不符合Stack Overflow guidelines .它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题，以
c++ - 帮助我理解这个 URL 解码器 :
在自己尝试 URL 解码之后，我设法想出了一些可行的想法 - 但它们不是很有效。由于 URL 解码是我的程序中可能出现严重瓶颈的地方，我决定上网寻找更有效的解决方案。我遇到了这篇 codeguru 文
java - 具有自定义拦截器的 JAXB 解码器？
是否可以“拦截” JAXB 的解码过程？我有一个 xml 响应，部分应该转换为不同的 java 字段结构: ... 在我的 java 类中，我更愿意将其解码为 List ，

首页

博学

6Ren·AI

商城

python - 在 IronPython 中使用编解码器读取 UTF-8 文件