gpt4 book ai didi

java - 如何使用 Java Html 类删除包含内容的特定 html 类

转载 作者:太空狗 更新时间:2023-10-29 15:13:38 25 4
gpt4 key购买 nike

最近在做一个android项目。我正在解析来自 wordpress api 的数据。但是详细的帖子内容是html格式的。我必须删除 html 标签。使用 Html.fromHtml().toString() java 方法我删除了所有标签。但是有一些图像标题我必须删除。要删除标题,我必须找到标签类。那么如何使用 Html Class 删除这些内容呢?

<p class="wp-caption-text">android m marshmallow</

编辑:

使用正则表达式我解决了我的问题。

Regex 中插入您的特定 Html你会得到你的正则表达式。

 yourHtml = yourHtml.replaceAll("Your_Regular_Expression","");
yourHtml = Html.fromHtml(yourHtml).toString();

最佳答案

如果你想得到一个匹配,你可以试试这个:

<(\w+).*?class="wp-caption-text".*?>[\s\S]*?<\/\1>

Regex101

我想提一下,这不是一个完美的解决方案。正则表达式不太擅长解析 html,因为该标记语言中的结构实际上太复杂了,正则表达式无法 100% 解析。参见 here

关于java - 如何使用 Java Html 类删除包含内容的特定 html 类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32123874/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com