gpt4 book ai didi

java - 使用java获取网页并处理带有换行符的标签

转载 作者:行者123 更新时间:2023-12-01 11:58:50 25 4
gpt4 key购买 nike

我可以使用以下函数获取网站内容:

try {
connection = new URL("http:xxx???.com").openConnection();
Scanner scanner = new Scanner(connection.getInputStream());
scanner.useDelimiter("\\Z");
content = scanner.next();

}catch ( Exception ex ) {
ex.printStackTrace();
}

但是,该页面包含标签
用于进入下一行,在本例中,我怎样才能在我的java中识别这个标签并在java代码中输入换行符?

谢谢

最佳答案

你可以这样做:

int index = content.indexOf("</b>");
System.out.println(index);

String temp1 = content.substring(0, index + 4);
System.out.println(temp1);

String temp2 = content.substring(index + 4);
System.out.println(temp2);

String withNL = temp1 + "\n" + temp2;
System.out.println(withNL);

虽然可能有更简单的解决方案;我不知道你的全部要求。我打印出一些内容,以便您可以看到发生了什么。

关于java - 使用java获取网页并处理带有换行符的</b>标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28133991/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com