gpt4 book ai didi

java - 尝试使用 Java 从文本中删除 html

转载 作者:可可西里 更新时间:2023-11-01 12:51:27 26 4
gpt4 key购买 nike

我有一个 ArrayList<String>名为 fields .我正在尝试解析每个 String 中的 HTML使用 replaceAll功能,但我觉得我搞砸了正则表达式字符串(我得到了第二个正则表达式 here 来表示一个通用的 html 表达式)。谁能给我一些关于如何在这里纠正自己的提示?

for(int j = 0; j<fields.size(); j++)    
{
String k = fields.get(j);
k.replaceAll("<br>", "\n");
k.replaceAll("<(\"[^\"]*\"|'[^']*'|[^'\">])*>", "");
k.replaceAll("&lt;", "<");
k.replaceAll("&gt;", ">");
fields.set(j, k);
}

最佳答案

请记住,字符串是不可变的,因此您希望在每次调用 replaceAll 时重新分配 k:

String k = fields.get(j);
k = k.replaceAll("<br>", "\n");
...

关于java - 尝试使用 Java 从文本中删除 html,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12754408/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com