gpt4 book ai didi

java - HTML 标签查找器

转载 作者:搜寻专家 更新时间:2023-10-31 23:04:45 25 4
gpt4 key购买 nike

我正在尝试创建一种方法来查找并返回给定 HTML 字符串中的第一个标记,如果未找到此类标记,则返回 null。 (标签类似于 <b> )

我查看了 String 类方法,但找不到适合此目的的方法。我在想我的计划是扫描每个单词的“<”,然后一旦找到,扫描“>”,但我不确定如何这样做。还想知道我是否应该在那里放一个 while/for 循环?感谢您的帮助,谢谢。

public class HTMLProcessor {

public static void main(String[] args) {
System.out.println(findFirstTag("<b>The man jumped.</b>"));
}

public static String findFirstTag(String text) {
int firstIndex = text.indexOf("<");
if (firstIndex >= 0) {
String newText = text.substring(firstIndex);
int secondIndex = newText.indexOf(">");

return text.substring(firstIndex, secondIndex + 1);
} else {
return null;
}

}

最佳答案

您可以尝试使用 String 类中的 indexOf()lastIndexOf() 方法。

您肯定需要一个 HTML 解析器,只需选择一个即可。 Jsoup是最好的 html 解析器之一。

考虑到您在多个地方多次执行此操作。

And do not prefer much for regex while dealing with html strings

关于java - HTML 标签查找器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20956406/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com