gpt4 book ai didi

python - 如何在 Python 3.1 中对字符串中的 HTML 实体进行转义?

转载 作者:IT老高 更新时间:2023-10-28 20:21:53 29 4
gpt4 key购买 nike

我环顾四周,只找到了适用于 python 2.6 及更早版本的解决方案,没有关于如何在 python 3.X 中执行此操作。 (我只有Win7盒子。)

我必须能够在 3.1 中做到这一点,最好没有外部库。目前,我已经安装了 httplib2 并可以访问命令提示符 curl(这就是我获取页面源代码的方式)。不幸的是,curl 不解码 html 实体,据我所知,我在文档中找不到解码它的命令。

是的,我尝试过让 Beautiful Soup 工作,但在 3.X 中很多次都没有成功。如果您能提供关于如何使其在 MS Windows 环境中的 python 3 中工作的明确说明,我将不胜感激。

所以,为了清楚起见,我需要像这样转换字符串:Suzy & John 变成这样的字符串:“Suzy & John”。

最佳答案

你可以使用函数html.unescape :

Python3.4+ 中(感谢 J.F. Sebastian 的更新):

import html
html.unescape('Suzy & John')
# 'Suzy & John'

html.unescape('"')
# '"'

Python3.3 或更早版本:

import html.parser    
html.parser.HTMLParser().unescape('Suzy & John')

Python2中:

import HTMLParser
HTMLParser.HTMLParser().unescape('Suzy & John')

关于python - 如何在 Python 3.1 中对字符串中的 HTML 实体进行转义?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2360598/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com