gpt4 book ai didi

html - HTML 标签的正则表达式

转载 作者:搜寻专家 更新时间:2023-10-31 08:17:20 24 4
gpt4 key购买 nike

我正在研究词法分析器。我有一个 HTML 文件。我想将文件中的每个字母(除了 HTML 标记中写入的任何内容)转换为大写字母。示例:

<html>
<body>
StackOverFlow
</body>
</html>

这将转换为以下内容。

<html>
<body>
STACKOVERFLOW
</body>
</html>

我只想知道将选择 HTML 标记中的所有内容而不对它们执行任何操作的正则表达式。

只考虑 < 内的简单 HTML 标签和 > .

最佳答案

使用以下任一正则表达式:

(?<=<)[^<]+(?=>)

解释: (?<=<) - 检查我们是否有 < (不要消费)在[^<]+之前(1 个或多个非左括号)(消耗),然后检查我们是否有 >在它之后 (?=>) (不要食用)。由于我们只消耗中间部分,所以我们有 p而不是 <p>作为一场比赛。

或者,只是将括号与标签相匹配:

<[^<]+>

解释: <匹配单个文字 < , 然后 [^<]+匹配除 < 以外的 1 个或多个字符然后是单个文字 > .所有字符都被消耗掉,因此匹配看起来像<p>。 .

关于html - HTML 标签的正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30063326/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com