gpt4 book ai didi

python - 将数字字符引用符号转换为 unicode 字符串

转载 作者:太空狗 更新时间:2023-10-29 22:22:55 28 4
gpt4 key购买 nike

是否有标准的(最好是 Pythonic 的)方法将 &#xxxx; 符号转换为正确的 unicode 字符串?

例如,

מפגשי

应转换为:

מפגשי

这可以很容易地完成,使用字符串操作,但我想知道是否有一个标准库可以做到这一点。

最佳答案

使用HTMLParser.HTMLParser() :

>>> from HTMLParser import HTMLParser
>>> h = HTMLParser()
>>> s = "מפגשי"
>>> print h.unescape(s)
מפגשי

它是 standard library 的一部分,也是。


但是,如果您使用的是 Python 3,则必须从 html.parser 导入:

>>> from html.parser import HTMLParser
>>> h = HTMLParser()
>>> s = 'מפגשי'
>>> print(h.unescape(s))
מפגשי

关于python - 将数字字符引用符号转换为 unicode 字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17018709/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com