gpt4 book ai didi

html - 如何在 HTML 中添加匹配的开始标签

转载 作者:太空狗 更新时间:2023-10-29 16:36:17 30 4
gpt4 key购买 nike

我的 html 内容看起来像

<body>Hello world</div><div>New day</div></body>

我想解析这个 html 片段并在 Hello 之前添加一个起始 div 标记。我可以遵循什么方法?我尝试使用 HTMLCLeaner但它没有帮助基本上这意味着找到没有匹配开始 div 标签的结束 div 标签并添加它们。

最佳答案

如果您使用 java,请尝试使用 Jsoup .有点像

Jsoup.clean("<body><div>Hello world</div><div>New day</div></body>", Whitelist.relaxed());

这将为您提供正确的输出字符串。

更新

您可以使用 Jsoup.parse(html) 返回一个 Document,您可以在其上调用 toString() 来获取固定的 html这将包括所有 htmlbody 标签。它将为您提供以下 html 输出。

   <html>
<head></head>
<body>
<div>
Hello world
</div
<div>
New day
</div>
</body>
</html>

正如您所说,大多数解析器将修复结束标签而不是开始标签,因为它们无法决定开始标签的开始位置,除了在错误的结束标签之前,并且在那里添加开始标签将毫无用处在结束标记之前。

您可能需要按照下面 Trevor Hutto 的建议(基于堆栈的方法)实现您自己的逻辑,但它会根据您的要求有其自身的复杂性。

关于html - 如何在 HTML 中添加匹配的开始标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22260027/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com