gpt4 book ai didi

Python 2.x 字符串 : Unicode vs. 字节

转载 作者:行者123 更新时间:2023-11-28 21:48:52 24 4
gpt4 key购买 nike

我处理非我们的语言,有时仍然必须用 Python 2.x 编写。阅读本文:http://www.snarky.ca/why-python-3-exists Brett Cannon 让我想知道这是否意味着如果我使用的字符串只是字符而不是字节,我是否应该在我的所有字符串前加上 u,以避免字节字符串和 unicode 之间的潜在混淆-字符串?并且:这也适用于 Jython 吗?

最后一个问题:-*- coding: utf-8 -*- 完全独立于上述内容,仅提供文件本身的编码 - 正确吗?

最佳答案

是的,您想将文本保存在 unicode 对象(Python 3 中的 str 类型)中,并维护一个 Unicode 三明治(尽快解码传入的数据,推迟编码,直到数据需要退出您的应用程序)。参见 Ned Batchelder's excellent Unicode presentation .

这也适用于 Jython,它只是 Python 语言的另一种实现。

PEP 263 source code encoding declaration告诉解释器在解码源代码中的字节时使用什么编解码器。它有助于用非 ASCII 字节定义 Unicode 文字,但不规定源代码以外的其他数据是如何编码或解码的。

关于Python 2.x 字符串 : Unicode vs. 字节,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34546941/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com