gpt4 book ai didi

python - 覆盖python中的内置类型__str__方法

转载 作者:太空宇宙 更新时间:2023-11-04 03:05:41 24 4
gpt4 key购买 nike

我需要将一些代码从 Python2 移植到 Python3,主要问题似乎是字节类型,因为 str(bytes) 给我 b'%s' 结果,但是 '需要 %s',所以我决定重写字节类的 __str__() 方法来打印我想要的内容。

我试图用从字节继承的类修补 builtins.bytes,但这似乎只适用于一个文件而不适用于整个项目,也不影响字节文字( b'').

如果有任何其他方法(不那么痛苦)从 py2 移植到 py3,很高兴看到它们。

使用 .decode('UTF-8') 是 Not Acceptable ,因为项目超过 4k 行并且在所有必要的地方添加 decode 方法会导致 progressive bugs 计数,并且还有一些这些 .decode 位置在第 3 方库中。

我试着做这样的事情:

import builtins

class StrBytes(builtins.bytes):
def __str__(self):
return self.decode('UTF-8')

builtins.bytes = StrBytes

然后,如果我使用 bytes(),它会创建 StrBytes 对象,而 str(bytes()) 正是我想要的。这种方式不好,因为它不包括从字节文字构造字节对象:

>>> type(bytes())
<class 'StrBytes'>

>>> type(b'')
<class 'bytes'>

而且我不确定它是否适用于整个项目,而不仅仅是一个文件。

在我的代码的许多不同地方,我有这样的东西:

return b''.join(some_extra_values)

keys = [b'1', b'2', b'3'] # actually keys are given from another part of code
for key in keys:
some_dict[key] = some_value

some_dict['1'] # works in py2, not in py3, KeyError

最佳答案

文本的规则是“输入解码,输出编码”。尽管已经做了很多工作来使编写 v2 和 v3 之间兼容的代码变得更容易,但总会存在一些差异,而且 Python 3 不再定义 unicode 符号就是其中之一。

尝试修补 Python 中的内置类型并不是一个好主意。因为它们是在 C 中定义的,所以没有有效的方法来修补它们的方法。

一个可能有用的工具是

from __future__ import unicode_literals

当插入到程序开头时,会将所有字符串文字解释为 Unicode 字符串而不是字节串。

另一种调整代码的方法是利用 Python 3 未实现 unicode 名称这一事实来驱动特征检测。所以你可能会写,例如

try:
unicode = unicode # RHS raises NameError on Python 3
except NameError:
unicode = str

然后你可以通过书写来检查文本类型

if type(s) is unicode: 
...

并且比较应该适用于 v2 和 v3。

如果您在输入上正确解码,则不必插入许多解码调用,并且只需要在必须将字符串传递给某种外部工具时才需要编码。

关于python - 覆盖python中的内置类型__str__方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39574286/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com