gpt4 book ai didi

java - 从 html 文件中获取信息

转载 作者:行者123 更新时间:2023-12-01 05:16:22 28 4
gpt4 key购买 nike

我正在编写一个程序,从页面获取信息并将其放入 Excel 文件中。

问题是,我找不到搜索具有特定信息的标签的方法。

这是我的代码(到目前为止):

  private void getAll() throws IOException {

for (int i = 0;i<250;i++){
URL vurl = new URL("http://www.bamart.be/nl/artists/detail/" + i);
BufferedReader reader = new BufferedReader(new InputStreamReader(vurl.openStream()));
String line;
while ((line = reader.readLine()) != null){
if (line.equalsIgnoreCase("<div class=\"subcontent\">"){
System.out.println("Found info!");
}

printInfo(line,i);
}
}
}


private void printInfo(String info,int i){
System.out.println("/***********************************************/");
System.out.println("************\t" + info + "**********************/");
System.out.println("/************" +" Artist page:" + i + " of 999 **********************/" );


}

println 没有出现,但它在 html 文件中。

最佳答案

if (line.equalsIgnoreCase("<div class=\"subcontent\">"){ }

此 if 语句正在检查是否完全相等(忽略大小写),但是该行上可能还有其他内容,例如包括空格。

你可能想要的是类似的东西

if (line.toLowerCase().contains("<div class=\"subcontent\">") { }

关于java - 从 html 文件中获取信息,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11159709/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com