- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我有一个 UTF-8 格式的字符串,但不确定如何将此字符串转换为相应的字 rune 字。例如我有字符串:
我的字符串是:'Entre\xc3\xa9'
例子一:
这段代码:
u'Entre\xc3\xa9'.encode('latin-1').decode('utf-8')
返回结果:u'Entre\xe9'
如果我继续打印这个:
print u'Entre\xe9'
我得到的结果是:Entreé
这太棒了,接近我的需要。问题是,我不能使 'Entre\xc3\xa9' 成为一个变量并通过这些步骤传递它,因为这现在中断了。有什么技巧可以让它发挥作用吗?
例子:
a = 'Entre\xc3\xa9'
b = 'u'+ a.encode('latin-1').decode('utf-8')
c= 'u'+ b
我希望“c”的结果是:
Entreé
最佳答案
u''
语法仅适用于字符串文字,例如在源代码中定义值。使用语法会创建一个 unicode
对象,但这不是创建此类对象的唯一方法。
您不能通过在字节字符串前面添加 u
来从字节字符串生成 unicode
值。但是,如果您使用正确的编码调用 str.decode()
,您将获得一个 unicode
值。反之亦然,您可以使用 unicode.encode()
将 unicode
对象编码为字节字符串。
请注意,当显示一个 unicode
对象时,Python 再次使用 Unicode 字符串文字语法表示它(所以 u'...'
), 以方便调试。您可以将表示粘贴回 Python 解释器并获得具有相同值的对象。
您的 a
值是使用字节字符串文字定义的,因此您只需要解码:
a = 'Entre\xc3\xa9'
b = a.decode('utf8')
您的第一个示例创建了一个 Mojibake ,一个 Unicode 字符串,其中包含实际表示 UTF-8 字节的 Latin-1 代码点。这就是为什么您必须先编码为 Latin-1(以撤消 Mojibake),然后从 UTF-8 解码。
您可能想在 Unicode HOWTO 中阅读有关 Python 和 Unicode 的内容.其他感兴趣的文章是:
关于python - 在 Python 中将 UTF-8 转换为字符串文字,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24571790/
由于 typescript 现在支持条件类型,我决定进行一些元编程,为 VSCODE intellisense 添加更多 flavor 。但是,虽然使用 A extends B 可以轻松分离其他类型,
我有一个 php var,它在回显时将 JS 函数写入页面的源代码。该函数循环遍历 CSV,因此其中包含以下行: $str="var lines = data.split('\n');"; 目前,当回
我有以下代码: name= "a"; value="b" $.post("ajax.php", {name:value}).... 然而 ajax.php 将收到 name=b 而不是 a=b。 我如
以下情况: var myVehicle = { brand: 'Tesla' }; var isMoving = Symbol(); var currentStatus = Symbol(); myV
我正在为 Python 翻译器编写 JavaScript,“\8”和“\9”给我带来了很多问题。根据文档,像“\8”或“\9”这样的东西是非法的,因为它们不是有效的八进制转义符。 Esprima pa
我有一个简单的 LinearLayout。当我将 android:background 添加到 LinearLayout 时,TextView 不再可见。 我不明白什么?
在尝试获得某种效果时遇到困难: 我有一张图片。我想将鼠标悬停在它上面。它应该变黑并弹出一些文本。 例子^ 执行此操作最简单/最简单的设置是什么?最好只有 HTML 和 CSS 注意:该元素需要在 CS
考虑以下代码: #include void f(const char * str) { str = "java"; } void main (int argc, char * argv[])
我想在 MySQL 中插入一条具有非 ASCII Unicode 字符的记录,但我在一个不允许我轻松键入非 ASCII 字符的终端上。如何在 MySQL 的 SQL 语法中转义 Unicode 文字?
Perl脚本batchReplace.pl可以用来批量替换文件中的文字/代码。可在指定目录中查找指定类型的文件,并递归检查子目录;在输出文件时复制输入文件的目录结构。 [附件]Win32应用程序b
我知道从 flutter 应用程序共享的官方包。 https://pub.dartlang.org/packages/share 共享文本和 url 很容易,但我想共享来自服务器的图像意味着它是 UR
在 Qt 文档中,它说 qreal是一个 Typedef for double unless Qt is configured with the -qreal float option. 这基本上意味
我想让 idris 证明 testMult : mult 3 3 = 9有人居住。 不幸的是,这是键入为 mult (fromInteger 3) (fromInteger 3) = fromInte
如您所知,Apple 为 NSNumber、NSDictionary、NSArray 等类提供了 @literals,因此我们可以通过这种方式创建对象,例如 NSArray *array = @[ob
有没有办法在类型上定义公共(public)文字(C# 中的公共(public) const)?显然 let 类型中的绑定(bind)必须是私有(private)的,并且 Literal 属性不能应用于
为什么下面的语法不能识别 bool 值? 我已经将其与 Java 和 GraphQL 的语法进行了比较,但不明白为什么它不起作用。 给定以下语法,解析如下: foo = null // foo = v
当我需要一个文字来测试一个带有序列的函数时,我注意到我自己的习惯比列表更频繁地使用向量。 IE。 : (map inc [1 2 3]) 但不是: (map inc (list 1 2 3)) 虽然它
是否可以在sqlite中制作类似的东西? FOREIGN KEY(TypeCode, 'ARawValue', IdServeur) REFERENCES OTHERTABLE(TypeCode, T
在我这学期的系统软件类(class)中,我们正在学习汇编程序和其他系统软件。在阅读整个类(class)时,我遇到了LITERALS主题。 对文字和立即操作数进行了比较,发现它们之间的唯一区别是文字不被
我正在使用命令行语法编写一个 gstreamer 管道来发送视频流,并想用它发送数据。我认为可行的一种解决方案是将数据作为字幕文件发送。 我可以使用以下管道通过 rtp 多路复用视频和字幕文件: gs
我是一名优秀的程序员,十分优秀!