- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我的波兰艺术家名字如下:
Żółte słonie
在我的数据集(json 文件)中,它已编码为:
\u017b\u00f3\u0142te S\u0142onie
我正在读取 json 并进行一些预处理并将输出写入文本文件。我收到以下错误:
UnicodeEncodeError: 'charmap' codec can't encode character u'\u017b' in position 0: character maps to <undefined>
我在线查找了波兰语字符的 Unicode 编码,该编码对我来说看起来不错。由于我以前从未使用过拉丁语以外的任何语言,因此我想向 SO 社区确认这一点。如果编码是正确的,那么为什么Python不处理它?</p>
谢谢,TM
最佳答案
我用Python 2.7做了简单的测试,似乎json
将对象类型从str
更改为unicode
。因此,在将其写入文本文件之前,您必须对此类字符串进行encode()
。
#!/usr/bin/env python
# -*- coding: utf8 -*-
import json
s = 'Żółte słonie'
print(type(s))
print(repr(s))
sd = json.dumps(s)
print(repr(sd))
s2 = json.loads(sd)
print(type(s2))
print(repr(s2))
f = open('out.txt', 'w')
try:
f.write(s2)
except UnicodeEncodeError:
print('UnicodeEncodeError, encoding data...')
f.write(s2.encode('UTF8'))
print('data encoded and saved')
f.close()
关于python - Python 中波兰语字符的 Unicode 编码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23286663/
我的 MIPS 汇编类(class)要求我将未知大小的表达式读入解析树。我从来不用处理树,所以这就是我存储值的方式: 假设用户输入了表达式 1 + 3 - 4(每个操作数只能是数字 1-9) 我最左边
这个问题已经有答案了: Remove diacritical marks (ń ǹ ň ñ ṅ ņ ṇ ṋ ṉ ̈ ɲ ƞ ᶇ ɳ ȵ) from Unicode chars (12 个回答) Jav
我的软件支持多种语言(英语、德语、波兰语、俄语……)。 出于这个原因,我有一些特定语言的文件,其中包含特定语言的对话框文本(编码为 UTF-8)。在我的 mfc 应用程序中,我打开并读取这些文件并将文
我有以下 xsl-fo 代码,试图生成外来字符。 ... Odwrotna strona tego pisma zawiera ważne informacje. je
我是一名优秀的程序员,十分优秀!