python - 为什么我收到 SyntaxError : (unicode error) 'utf-8' codec can't decode byte 0x96 in position 0: invalid start byte-6ren

python - 为什么我收到 SyntaxError : (unicode error) 'utf-8' codec can't decode byte 0x96 in position 0: invalid start byte

转载作者：太空宇宙更新时间：2023-11-04 10:25:17

25

4

我从 API 获得了一些 json 数据。我使用 json.loads 然后将其打印到如下所示的 REPL。

  {'warnings': {'query': {'*': "Formatting of continuation data will be changing soon. To continue using the current formatting, use the 'rawcontinue' parameter. To begin using the new format, pass an empty string for 'continue' in the initial query."}}, 'query-continue': {'links': {'plcontinue': '25618423|10|R_from_other_capitalisation', 'gplcontinue': "15095968|0|1991_US_Open_-_Women's_Doubles"}}, 'query': {'pages': {'32203010': {'pageid': 32203010, 'title': "1988 Australian Open - Women's Doubles", 'ns': 0}, '25618558': {'pageid': 25618558, 'title': "1984 Wimbledon Championships - Women's Singles", 'ns': 0}, '29486043': {'pageid': 29486043, 'title': "1984 Wimbledon Championships - Women's Doubles", 'ns': 0}, '25618819': {'pageid': 25618819, 'title': "1986 US Open - Women's Singles", 'ns': 0}, '25619314': {'pageid': 25619314, 'title': "1989 US Open - Women's Singles", 'ns': 0}, '25618668': {'pageid': 25618668, 'title': "1985 US Open - Women's Singles", 'ns': 0}, '25618857': {'pageid': 25618857, 'title': "1987 Australian Open - Women's Singles", 'ns': 0}, '25618423': {'links': [{'title': "1983 Wimbledon Championships – Women's Singles", 'ns': 0}, {'title': 'Wikipedia:Mainspace', 'ns': 4}, {'title': 'Template:R from long name', 'ns': 10}], 'pageid': 25618423, 'title': "1983 Wimbledon Championships - Women's Singles", 'ns': 0}, '23826062': {'links': [{'title': "1984 French Open – Women's Singles", 'ns': 0}, {'title': 'Wikipedia:Mainspace', 'ns': 4}, {'title': 'Template:R from long name', 'ns': 10}, {'title': 'Template:R from other capitalisation', 'ns': 10}, {'title': 'Template:R from plural', 'ns': 10}, {'title': 'Template:R from short name', 'ns': 10}, {'title': 'Category:Redirects from modifications', 'ns': 14}], 'pageid': 23826062, 'title': "1984 French Open - Women's Singles", 'ns': 0}, '25619177': {'pageid': 25619177, 'title': "1989 Australian Open - Women's Singles", 'ns': 0}}}}

然后我将该数据从 repl 复制到 .py 模块并分配给一个变量，以便我可以执行一些单元测试。但我不断收到此错误:

SyntaxError: (unicode error) 'utf-8' codec can't decode byte 0x96 in position 0: invalid start byte

这是怎么回事？

更新:我得到错误的确切方式。我使用 Visual Studio 运行了一个脚本，该脚本使用 Requests 和 .text 获取数据以获取内容。然后我应用了 json.loads。我将其打印到 Visual Studio Python 3.4 Interactive(又名 REPL)。然后我使用鼠标从这个 REPL 复制并粘贴到 Visual Studio 中的 .py 文件中。

更新 2:因此，当我获取数据时，我使用请求，然后使用文本属性。当我在没有 json.loads 的情况下打印它时，它很好。但是，如果我从 REPL 复制这个“更原始”并粘贴，它不再是字符串而是对象，JSON 加载将不起作用。 python 3 打印函数是否打印对象，即使它应该是 json？

这是 API 使用 Requests.text 的原始无 json.loads 输出:

{"warnings":{"query":{"*":"Formatting of continuation data will be changing soon. To continue using the current formatting, use the 'rawcontinue' parameter. To begin using the new format, pass an empty string for 'continue' in the initial query."}},"query-continue":{"links":{"plcontinue":"25618423|10|R_from_other_capitalisation","gplcontinue":"15095968|0|1991_US_Open_-_Women's_Doubles"}},"query":{"pages":{"25618423":{"pageid":25618423,"ns":0,"title":"1983 Wimbledon Championships - Women's Singles","links":[{"ns":0,"title":"1983 Wimbledon Championships \u2013 Women's Singles"},{"ns":4,"title":"Wikipedia:Mainspace"},{"ns":10,"title":"Template:R from long name"}]},"23826062":{"pageid":23826062,"ns":0,"title":"1984 French Open - Women's Singles","links":[{"ns":0,"title":"1984 French Open \u2013 Women's Singles"},{"ns":4,"title":"Wikipedia:Mainspace"},{"ns":10,"title":"Template:R from long name"},{"ns":10,"title":"Template:R from other capitalisation"},{"ns":10,"title":"Template:R from plural"},{"ns":10,"title":"Template:R from short name"},{"ns":14,"title":"Category:Redirects from modifications"}]},"29486043":{"pageid":29486043,"ns":0,"title":"1984 Wimbledon Championships - Women's Doubles"},"25618558":{"pageid":25618558,"ns":0,"title":"1984 Wimbledon Championships - Women's Singles"},"25618668":{"pageid":25618668,"ns":0,"title":"1985 US Open - Women's Singles"},"25618819":{"pageid":25618819,"ns":0,"title":"1986 US Open - Women's Singles"},"25618857":{"pageid":25618857,"ns":0,"title":"1987 Australian Open - Women's Singles"},"32203010":{"pageid":32203010,"ns":0,"title":"1988 Australian Open - Women's Doubles"},"25619177":{"pageid":25619177,"ns":0,"title":"1989 Australian Open - Women's Singles"},"25619314":{"pageid":25619314,"ns":0,"title":"1989 US Open - Women's Singles"}}}}

最佳答案

您的文本中有 EN DASH (U+2013) 个字符。在 Windows-1252 编解码器中，它们映射到字节 \x96。您遇到了编码问题，但具体原因取决于您将文本复制到 .py 文件所采取的步骤。我将你问题中的文本剪切并粘贴到 Notepad++ 中，编码设置为 ANSI 并将其分配给一个变量并简单地得到:

  File "C:\temp.py", line 1
SyntaxError: unknown decode error

但是选择 UTF-8 或 UTF-8 without BOM 作为编码它工作正常。如果没有声明源编码的 #coding: 注释，Python 3 假定为 UTF-8。

请注意，在我的美国 Windows 系统上，ANSI 实际上是 Windows-1252。使用 ANSI 并添加 #coding:windows-1252 也能正常工作。如果源编码不同于默认编码(Python 2 上的 ascii 和 Python 3 上的 utf-8)，Python 需要知道它。

关于python - 为什么我收到 SyntaxError : (unicode error) 'utf-8' codec can't decode byte 0x96 in position 0: invalid start byte，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/29711124/

25

4

0

文章推荐： html - Chrome 没有显示我的 tumblr 博客的图标？

文章推荐： linux - 读取返回 ERESTARTSYS 后被 SIGHUP 杀死的进程

文章推荐： java - 将模型从一个 Activity 传递到另一个 Activity 时出错

c# - byte = byte - byte 需要类型转换吗？
我有以下代码: foreach (byte b in bytes) { byte inv = byte.MaxValue - b; // Add the new value to a
Java文件逆向读写【byte by byte】
我需要从这个文本文件source.txt中读取内容并将内容反向写入这个文本文件destination.txt。读取和写入必须使用逐字节完成! 我使用 BufferedReader 和 Buffered
java - 在 Java 中存储颜色 - byte;byte;byte vs. byte[3] vs int
我需要存储大量 RGB 颜色对象。对于某些常见用途，这些占用了我的应用程序总内存的 8% 到 12%。我目前将其定义如下: class MyColor { byte red; byte green;
java - Bytes.toString(bytes) 和 bytes.toString() 有什么区别？
我有一个由字节数组表示的整数。 byte[] result = getResult(); resultInt1 = Integer.parseInt(Bytes.toString(result));/
rust - 如何从 std::string::String 获取 bytes::bytes::Bytes？
我正在尝试使用 Rusoto 库调用 AWS Lambda 函数。该请求有一个 JSON 编码的有效负载，我目前将其作为一个字符串，但该库为此坚持使用 bytes::bytes::Bytes 结构。我
rust - 如何通过 futures:stream::Stream 发送 bytes::bytes::Bytes？
我正在尝试基于 Tokio's example 编写一个 TCP 服务器. 当我尝试发送缓冲区时，编译器返回错误 0277。我的代码:(playground) extern crate tokio;
c# - 是否可以将 IList> 转换为 byte[] 而无需枚举列表并添加到新的 byte[]？
我知道我可以通过 IList 进行枚举，例如: public byte[] ConvertToByteArray(IList> list) { IList newList = new List
go - bytes.String() 与 bytes.Bytes() 在 Go 中
考虑这样一个文本文件: Some text here. --- More text another line. --- Third part of text. 我想把它分成三部分，用---分隔符分开。
java - 为什么 byte += 1 编译但 byte = byte + 1 不编译？
如果我有一个字节变量:byte b = 0; 为什么以下工作: b++; b += 1; // compiles ...但这不是吗？ b = b + 1; // compile er
java - 创建自定义 getColor(byte r, byte g, byte b) 方法
我有一个简单的字节数组，我想从中获取颜色。我的计划是用红色表示三位，绿色表示三位，蓝色表示两位。 8 位。我认为颜色是正确的: 如有错误请指正 byte[] colours = new byte[
java - 我有两个 byte[] ，我需要比较这个 byte[] 之间的字符串，是否需要显式转换 new String(byte[])
我的目标是比较两个字节数组中的两个字符串值。它实际上需要创建两个新的字符串对象才能使用 contains 方法。是选择正确还是有什么办法可以使用优化方式而不使用新的关键字。 if(new String
arrays - [] byte {10}或[] byte(“\n”)与[] byte {92，110}
我正在使用github.com/tarm/serial来连接一些串行仪器。在开发过程中，我使用/dev/ttyp0和/dev/ptyp0对，其中go进程连接到一个，我使用screen连接到另一个。我编
byte - "half-byte"是否真的用作术语？
好的，所以如果一个字节是 8 位，那么半字节就是 4 位。并且您可以将四分之一字节作为 2 位(尽管我想，如果有的话，它会被称为双位)。虽然这是一致的，但如果我使用这个词，有人会感到困惑(或惊讶)吗
java - byte[] 到字符串并返回 byte[]
我在解释文件时遇到问题。文件构建如下: "name"-@-"date"-@-"author"-@-"signature" 签名是一个字节数组。当我读回文件时，我将其解析为 String 并拆分它: m
c++ - "by the bytes"与 "in bytes"
关闭。这个问题是off-topic .它目前不接受答案。想改进这个问题吗？ Update the question所以它是on-topic用于堆栈溢出。关闭 10 年前。 Improve thi
Java:byte[] 到 Byte[]
Java 让我很难过，因为它需要 ArrayList 的包装类秒。我将如何添加 byte[]到 ArrayList ？最佳答案 LOL 认为我必须包装所有东西。 ArrayList作品。谢谢一晒。
postgresql - Postgres : How to convert 16 bytes into 4 bytes by XOR-ing every 4 bytes
我有一个 16 字节的 md5 散列，我需要使用 XOR 将其“折叠”成 4 字节数据:{1st 4 bytes} XOR {2nd 4 bytes} XOR {3rd 4 bytes} XOR {4
linux - 对 "three successive writes: bytes 10, bytes 32, bytes 54"感到困惑？
我正在学习SMSC smc91cx驱动代码，我学习了如何根据Application Note 9-6的说明编写smc91c111网卡的测试代码。 .我无法理解“传输数据包”下的以下说明: Write
java - 我可以使用 addAll Collection 方法添加所有元素(类型 :byte) from arrays(byte[]) to a List of type Byte?
我必须附加(可变数量的)字节数组。集合似乎只适用于包装类，即 Byte。大约 20 小时后，我想到了这个，并且它有效，但我想知道它是否可以改进(添加到列表，但欢迎任何其他改进建议:)，即 Collec
c - 通过 'insert bytes' 使 'remove bytes' 和 'insert bytes' 一起工作，并具有正/负偏移量
我有两个基本相同的操作: insert_bytes(from, count) delete_bytes(start, stop) -> delete_bytes(from, count) insert

首页

博学

6Ren·AI

商城

python - 为什么我收到 SyntaxError : (unicode error) 'utf-8' codec can't decode byte 0x96 in position 0: invalid start byte