gpt4 book ai didi

java - Java中如何捕获特定浏览器内容?

转载 作者:行者123 更新时间:2023-12-02 03:53:16 25 4
gpt4 key购买 nike

我正在使用 Java 中的 htmlunit api 库访问网站 ( http://www.bacnet.org/Addenda/ )。

我能够获取整个页面的内容,但我只想捕获特定区域。

这就是我获取页面的方式:

public static void getBACnetStandard() throws FailingHttpStatusCodeException, 
MalformedURLException, IOException
{
WebClient webClient = new WebClient(BrowserVersion.CHROME);
webClient.getOptions().setJavaScriptEnabled(true);
HtmlPage page = webClient.getPage("http://www.bacnet.org/Addenda/");
String pageContent = page.asText();
System.out.println(pageContent);
}

我想从整个页面捕获突出显示的区域(红色框中)。

enter image description here

最佳答案

首先获取HtmlPage上Element的Id

HtmlPage page = webClient.getPage("http://www.bacnet.org/Addenda/");
// inspect target_div_id and get that Element here
HtmlDivision div = page.getHtmlElementById("target_div_id");

或者您想使用其他自定义属性来获取该 DOM 元素,就像我使用 target_class_value 给出的示例

HtmlPage page = webClient.getPage("http://www.bacnet.org/Addenda/");
// inspect target_class_value and get that Element here
HtmlDivision div = page.getByXPath("//div[@class='target_class_value']");

关于java - Java中如何捕获特定浏览器内容?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56765814/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com