- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我使用 json.dump 转储 dict 对象。为了避免 UnicodeDecodeError
,我按照 this advice 设置了 ensure_ascii=False
.
with open(my_file_path, "w") as f:
f.write(json.dumps(my_dict, ensure_ascii=False))
转储文件已成功创建,但加载转储文件时出现 UnicodeDecodeError:
with open(my_file_path, "r") as f:
return json.loads(f.read())
如何避免加载转储文件时出现UnicodeDecodeError
?
错误消息是UnicodeDecodeError:'utf8'编解码器无法解码位置0中的字节0x93:无效的起始字节
并且堆栈跟踪是:
/Users/name/.pyenv/versions/anaconda-2.0.1/python.app/Contents/lib/python2.7/json/__init__.pyc in loads(s, encoding, cls, object_hook, parse_float, parse_int, parse_constant, object_pairs_hook, **kw)
336 if (cls is None and encoding is None and object_hook is None and
337 parse_int is None and parse_float is None and
--> 338 parse_constant is None and object_pairs_hook is None and not kw):
339 return _default_decoder.decode(s)
340 if cls is None:
/Users/name/.pyenv/versions/anaconda-2.0.1/python.app/Contents/lib/python2.7/json/decoder.pyc in decode(self, s, _w)
364 obj, end = self.raw_decode(s, idx=_w(s, 0).end())
365 end = _w(s, end).end()
--> 366 if end != len(s):
367 raise ValueError(errmsg("Extra data", s, end, len(s)))
368 return obj
/Users/name/.pyenv/versions/anaconda-2.0.1/python.app/Contents/lib/python2.7/json/decoder.pyc in raw_decode(self, s, idx)
380 obj, end = self.scan_once(s, idx)
381 except StopIteration:
--> 382 raise ValueError("No JSON object could be decoded")
383 return obj, end
UnicodeDecodeError: 'utf8' codec can't decode byte 0x93 in position 0: invalid start byte
最佳答案
在Python2中,您可以在调用json.loads
之前使用ensure_ascii=False
并解码结果:
import json
my_dict = {b'\x93': [b'foo', b'\x93', {b'\x93': b'\x93'}]}
dumped = json.dumps(my_dict, ensure_ascii=False)
print(repr(dumped))
# '{"\\u201c": ["foo", "\\u201c", {"\\u201c": "\\u201c"}]}'
result = json.loads(dumped.decode('cp1252'))
print(result)
# {u'\u201c': [u'foo', u'\u201c', {u'\u201c': u'\u201c'}]}
但是请注意,json.loads
返回的结果
包含unicode
,而不是str
。因此结果
与my_dict
并不完全相同。
请注意json.loads
always decodes strings to unicode ,因此,如果您有兴趣使用 json.dumps
和 json.loads
忠实地恢复字典,那么您需要从仅包含 unicode< 的字典开始
,没有 str
s。
此外,在 Python3 中 json.dumps
要求所有字典的键都是 unicode 字符串。所以上面的解决方案在Python3中不起作用。
在 Python2 和 Python3 中都可以使用的替代方法是确保您传递 json.loads
一个字典,其键和值为 unicode
(或不包含str
s)。例如,如果您使用 convert
(如下)递归地更改键和值在传递给 json.loads
之前先转换为 unicode
:
import json
def convert(obj, enc):
if isinstance(obj, str):
return obj.decode(enc)
if isinstance(obj, (list, tuple)):
return [convert(item, enc) for item in obj]
if isinstance(obj, dict):
return {convert(key, enc) : convert(val, enc)
for key, val in obj.items()}
else: return obj
my_dict = {'\x93': ['foo', '\x93', {'\x93': '\x93'}]}
my_dict = convert(my_dict, 'cp1252')
dumped = json.dumps(my_dict)
print(repr(dumped))
# '{"\\u201c": ["foo", "\\u201c", {"\\u201c": "\\u201c"}]}'
result = json.loads(dumped)
print(result)
# {u'\u201c': [u'foo', u'\u201c', {u'\u201c': u'\u201c'}]}
assert result == my_dict
convert
将解码 my_dict
内的列表、元组和字典中找到的所有 str
。
上面,我使用 'cp1252'
作为编码,因为(如 Fumu pointed out )用 cp1252
解码的 '\x93'
是左双引号
:
In [18]: import unicodedata as UDAT
In [19]: UDAT.name('\x93'.decode('cp1252'))
Out[19]: 'LEFT DOUBLE QUOTATION MARK'
如果您知道 my_dict
中的 str
已使用其他编码进行编码,您当然应该使用该编码来调用 convert
。
更好的是,不要使用 convert
,而是在构建时注意确保所有 str
都解码为 unicode
my_dict
。
关于python - python 2.x 中 json.dump 后 json.loads 上的 UnicodeDecodeError 与 Ensure_ascii=False,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35880789/
class test { public static void main(String[] args){ Object o1 = new Object(); O
我以为我理解了 Python 中的这两个单例值,直到我看到有人在代码中使用 return l1 or l2,其中 l1 和 l2 都是链表对象,并且(s)他想如果不为 None 则返回 l1,否则返回
这个问题在这里已经有了答案: Why does the expression 0 >> (True == False) is False True >>> True == (False is Fals
为什么在 Python 中它是这样评估的: >>> False is False is False True 但是当用括号尝试时表现如预期: >>> (False is False) is False
我有一个名为“apple”的表,我编写了以下查询: select name, count(name), case when istasty is null then fal
python boolean 逻辑中的运算符优先级 print(False==True or False) #answer is True print(False==(False or True))#
请不要看条件,因为它们在这里是为了便于理解行为 为什么 result 等于 true ? boolean result = false && (false)?false:true; 我知道我们可以通过
乍一看,这篇文章可能看起来像是重复的,但事实并非如此。相信我,我已经查看了所有 Stack Overflow,但都无济于事。 无论如何,我从 Html.CheckBoxFor 得到了一些奇怪的行为。
这个问题在这里已经有了答案: python operator precedence of in and comparison (4 个答案) 关闭 6 年前。 我的一位前辈演示了它,我想知道这是否是
我最近参加了 Java 的入门测试,这个问题让我很困惑。完整的问题是: boolean b1 = true; boolean b2 = false; if (b2 != b1 != b2) S
为什么 {} == false 评估为 false 而 [] == false 评估为 true在 javascript 中? 最佳答案 这是根据 Abstract Equality Comparis
这个问题在这里已经有了答案: Why does (1 in [1,0] == True) evaluate to False? (1 个回答) 关闭7年前。 为什么使用括号时这些语句按预期工作: >>
我试过搜索这个,但我真的不知道如何表达它以查看是否有其他人发布了答案。 但是,我正在制作一个国际象棋游戏和一个人工智能来配合它,这是非常困难的,我的问题是当我检查两个棋子是否在同一个团队时我必须做 (
关闭。这个问题需要debugging details .它目前不接受答案。 编辑问题以包含 desired behavior, a specific problem or error, and th
为什么 为 false || null 返回与 null || 不同的结果错误? 我可以安全地依赖 return myVar || false 如果 myVar 为 null 或 false,则返回
我正在尝试遵循 NHibernate 教程,“你的第一个基于 NHibernate 的应用程序:修订 #4”在 NHibernate Forge。 但线路:new SchemaExport(cfg).
这个问题在这里已经有了答案: Empty list boolean value (3 个答案) 关闭 4 年前。 我是 Python 的新手,不理解以下行为: 为什么要声明 [] == False
以下函数循环访问对象的值。如果值为空this.hasInvalidValue设置为true ,如果不为空 this.hasInvalidValue设置为false : user: { email:
所以我正在玩 java.lang.reflect 东西并尝试制作类似 this 的东西。这是我的问题(可能是一个错误): 将字段设置为 true 的方法的代码: private static void
当我在编程时,我的 if 语句出现了意想不到的结果。 这个代码警报怎么会是真的?我在 W3S 没有找到任何可以帮助我的东西,我真的很想知道为什么这些警报是“正确的” window.alert(fals
我是一名优秀的程序员,十分优秀!