python - UnicodeDecodeError :'gbk' 编解码器无法解码位置 0 非法多字节序列中的字节 0x80-6ren

python - UnicodeDecodeError :'gbk' 编解码器无法解码位置 0 非法多字节序列中的字节 0x80

转载作者：太空宇宙更新时间：2023-11-03 12:32:39

36

4

我用的是python 3.4，win 7 64位系统。我运行了以下代码:

      6   """ load single batch of cifar """
      7   with open(filename, 'r') as f:
----> 8     datadict = pickle.load(f)
      9     X = datadict['data']

错误信息是UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 0: illegal multibyte sequence

我将第 7 行更改为:

      6   """ load single batch of cifar """
      7   with open(filename, 'r'，encoding='utf-8') as f:
----> 8     datadict = pickle.load(f)
      9     X = datadict['data']

错误信息变成了UnicodeDecodeError: 'utf-8' codec can't decode byte 0x80 in position 0: invalid start byte。

消息最终指向decode(self, input, final)中的Python34\lib\codecs.py。

    311         # decode input (taking the buffer into account)
    312         data = self.buffer + input
--> 313         (result, consumed) = self._buffer_decode(data, self.errors, final)
    314         # keep undecoded input until the next call
    315         self.buffer = data[consumed:]

我进一步修改了代码:

      6 """ load single batch of cifar """ 
      7 with open(filename, 'rb') as f:
----> 8 datadict = pickle.load(f) 
      9 X = datadict['data'] 10 Y = datadict['labels']

嗯，这次是 UnicodeDecodeError: 'ascii' codec can't decode byte 0x8b in position 6: ordinal not in range(128)。

问题是什么，如何解决？

最佳答案

Pickle 文件是二进制数据文件，因此加载时始终必须使用 'rb' 模式打开文件。不要在这里尝试使用文本模式。

您正在尝试加载包含字符串数据的 Python 2 pickle。您必须告诉 pickle.load() 如何将该数据转换为 Python 3 字符串，或者将它们保留为字节。

默认尝试将这些字符串解码为 ASCII，但解码失败。查看pickle.load() documentation :

Optional keyword arguments are fix_imports, encoding and errors, which are used to control compatibility support for pickle stream generated by Python 2. If fix_imports is true, pickle will try to map the old Python 2 names to the new names used in Python 3. The encoding and errors tell pickle how to decode 8-bit string instances pickled by Python 2; these default to ‘ASCII’ and ‘strict’, respectively. The encoding can be ‘bytes’ to read these 8-bit string instances as bytes objects.

将编码设置为latin1 允许您直接导入数据:

with open(filename, 'rb') as f:
    datadict = pickle.load(f, encoding='latin1')

似乎是 numpy 数组数据导致了这里的问题，因为集合中的所有字符串仅使用 ASCII 字符。

替代方法是使用 encoding='bytes' 但是所有文件名和顶级字典键都是 bytes 对象，你必须解码这些或者用 b 作为所有键文字的前缀。

关于python - UnicodeDecodeError :'gbk' 编解码器无法解码位置 0 非法多字节序列中的字节 0x80，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/28165639/

36

4

0

文章推荐： python - Pyinstaller 与 pygame

文章推荐： php - 在 mysql 中前进

文章推荐： php - 一个表格，一个按钮，一个mysql行

文章推荐： python - 未定义全局变量 - Python

Dart JSON 解码器
令我惊讶的是，dart 没有内置的对象到 json 和 json 到对象的映射器。我读到我们必须自己手动编写映射代码，这并不令人愉快。无论如何，虽然我没有针对我的用例对其进行彻底测试，但我发现了
java - 8位PCMU编码器/解码器
我有 16 位 PCM 音频，我想将其转换为 8 位 PCMU。据我所知，16 位到 8 位的转换很容易 - 只需从每个样本中删除最后 8 位即可。我想知道如何将8位pcm转换为8位pcmu？任何文
Java Jpeg 解码器
我的任务是使用动态霍夫曼修改 JPEG 格式。所以我试图找到用Java编写的简单Jpeg解码器的源代码。谁能帮我？最佳答案看看这个:http://www.dreamincode.net/forum
Java JSON 解码器
我收到错误代码(如下)，并且无法解码该字符串，我知道它正在查找 JSON 和我也保存的文件，但它无法解析。错误代码: Unexpected token VALUE(-10) at position 8
java - 随机编码器/解码器
我制作了这个程序，它是一个随 secret 码。 public class SaadAbdullahCipher { private char[] alphabet = {'a', 'b'
java - 如何创建编码器？解码器？
总的来说，我对编程还很陌生，我想知道如何对输入的文本进行编码/解码。对于 ex A -> D，所有字母必须减去 3 个字母B -> E等等我将输入一些伪代码作为示例: INPUT MESSAGE:
go - 获取字符集字符串的编码器/解码器
是否有内置函数或受支持的包中的函数来获取基于输入字符集字符串，例如 ISO-8859-1 或 ISO-8859-15？现在我看到的唯一方法是自己匹配它: func getEncoderForChars
JSON 解码器无法读取数据，因为它的格式不正确
我是新来的。不知何故，我能够理解如何做到这一点。我在下面做，但它给出了错误 - 无法读取数据，因为它的格式不正确。有人可以帮助我吗？从过去的 4 天开始，我一直坚持这一点。我真的很感激。 impor
json - 如何为复杂对象编写自定义 JSON 解码器？
就像标题所说，我正在尝试为一个我定义的类的对象编写一个自定义解码器，该对象包含我定义的类的其他对象。 “外部”类是一个 Edge，定义如下: class Edge: def __init__(
audio - 重新编码音频:gstreamer中的libav编码器/解码器
我想重新编码音频文件的音频流。以下gstreamer管道可以正常工作: gst-launch-1.0 filesrc location=input.flac ! decodebin ! audioco
Swift4 的 JSON 解码器
使用Swift4、iOS11.1、Xcode9.1，尝试匹配 Swift4 的可编码结构中的 JSON 文件，我遇到以下问题: 这是我的代码: struct Station: Codable {
java - WBXML 解析器/解码器
正如标题所示，我正在寻找遵循 1.3 版本的 Java(+Android) WBXML 解析器/解码器。如果有必要的话，我什至可以考虑调用 native 代码。谢谢。最佳答案我确实记得不久前我使用
java - 将架构位置添加到 JAXB 解码器
当 JABX 解码器尝试解码 xml 时，我遇到以下错误线程“main”中出现异常 javax.xml.bind.UnmarshalException - 带有链接异常:[org.xml.sax.S
python - Keras Conv2D 解码器
我正在处理不同尺寸(x，y)的图像。当在 MaxPooling2D 之后使用 UpSampling2D 时，它不能很好地重建它，因为 x-dim 不等于 y-dim。当 x=y (例如 28x28)时
javascript - 压缩 JS 解码器
http://www.lotterypost.com/js-compress.aspx 这个网站非常适合压缩 JS 但我想解码.... 除了在线之外，有没有最好的免费工具来编码/解码 Js 最佳答案
java - 不同的 Base64 解码器
我刚刚在验证 JWT 时遇到了问题。我正在运行的代码是一个相当肮脏的黑客，它采用 JWT 的第二个组件并通过 Base64 解码器运行它。然而事实证明，通过一些 super 特殊的 JWT，我得到了一
c++ - 将输出帧保存为图像文件 CUDA 解码器
我正在尝试使用 CUDA 解码器项目中的代码将解码后的图像文件保存回 BMP 图像。 if (g_bReadback && g_ReadbackSID)
c++ - FLV & F4V开源C++解码器
已关闭。此问题旨在寻求有关书籍、工具、软件库等的建议。不符合Stack Overflow guidelines .它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题，以
c++ - 帮助我理解这个 URL 解码器 :
在自己尝试 URL 解码之后，我设法想出了一些可行的想法 - 但它们不是很有效。由于 URL 解码是我的程序中可能出现严重瓶颈的地方，我决定上网寻找更有效的解决方案。我遇到了这篇 codeguru 文
java - 具有自定义拦截器的 JAXB 解码器？
是否可以“拦截” JAXB 的解码过程？我有一个 xml 响应，部分应该转换为不同的 java 字段结构: ... 在我的 java 类中，我更愿意将其解码为 List ，

首页

博学

6Ren·AI

商城

python - UnicodeDecodeError :'gbk' 编解码器无法解码位置 0 非法多字节序列中的字节 0x80