gpt4 book ai didi

python - 如何使用正则表达式从 python 中的字符串中删除标签? (不在 HTML 中)

转载 作者:太空狗 更新时间:2023-10-29 17:51:45 24 4
gpt4 key购买 nike

我需要从 python 中的字符串中删除标签。

<FNT name="Century Schoolbook" size="22">Title</FNT>

删除两端整个标签的最有效方法是什么,只留下“Title”?我只见过使用 HTML 标签执行此操作的方法,但在 python 中对我不起作用。我特别将其用于 GIS 程序 ArcMap。它有自己的布局元素标签,我只需要删除两个特定标题文本元素的标签。我相信正则表达式应该可以很好地解决这个问题,但我愿意接受任何其他建议。

最佳答案

这应该有效:

import re
re.sub('<[^>]*>', '', mystring)

对于所有说正则表达式不是这项工作的正确工具的人:

问题的上下文是这样的,所有关于常规/上下文无关语言的反对意见都是无效的。他的语言基本上由三个实体组成:a = < , b = > , 和 c = [^><]+ .他想删除所有出现的 acb .这相当直接地将他的问题描述为涉及上下文无关文法的问题,并且将其描述为常规问题并不难。

我知道每个人都喜欢“你不能用正则表达式解析 HTML”这个答案,但是 OP 不想解析它,他只想进行简单的转换。

关于python - 如何使用正则表达式从 python 中的字符串中删除标签? (不在 HTML 中),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3662142/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com