gpt4 book ai didi

python - 从字符串中取出一个 Unicode 字符并对其进行解码

转载 作者:太空宇宙 更新时间:2023-11-04 07:37:56 24 4
gpt4 key购买 nike

我目前正在使用 Python 工作,我正在从网上提取一大堆数据,包括照片的标题。我得到的一些字符串中有 unicode,我想将其显示为原始字符。

我知道如果我输入,例如,

print u'\u00a9'

即会将正确的字符输出到终端。

但是,如果我得到一个字符串,例如:

string = 'Copyright \u00a9 David'

我不知道怎么把它拉出来。

我设法用 RegEx 提取了字符代码,但我不知道如何在不出错的情况下将其重新插入。

我试过:

char = \u00a9
string = 'Copyright' + u'char' + 'David'

这并没有真正起作用。

我需要一种方法来以编程方式提取代码(我可以使用 RegEx 来完成),然后重新插入到原始字符串中,并在其前面加上 u'。

最佳答案

我认为您误解了 u 是什么。这是一种在代码中识别和显示 unicode 文字 的方法,与将字符串变量从一种表示形式转换为另一种表示形式无关。

您实际需要的是使用“unicode-escape”编解码器解码字符串:

>>> print string.decode('unicode-escape')
Copyright © David

关于python - 从字符串中取出一个 Unicode 字符并对其进行解码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30071067/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com