gpt4 book ai didi

python - 正则表达式选择 HTML 标签内的特定字符

转载 作者:行者123 更新时间:2023-11-28 19:22:41 24 4
gpt4 key购买 nike

我只寻找标准标签,如 p、title、h1、h2 等。

<[/a]*>content resides in here</[/a]*>

我专门寻找标点符号来对抗潜在的 SQL 注入(inject)。此外,对于这个项目,我无法使用 BeautifulSoup。

最佳答案

试试这个正则表达式:

<(a|h1|p|title)[^>]*>([^<]+)</\1[^>]*>

讨论

Regular expression visualization

演示

http://regex101.com/r/mB4bQ1

讨论

我假设标签只包含文本,没有标签...
Python 不支持递归正则表达式。

关于python - 正则表达式选择 HTML 标签内的特定字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21316262/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com