gpt4 book ai didi

java - JSoup,如何从动态 标记返回数据

转载 作者:行者123 更新时间:2023-12-05 00:18:13 24 4
gpt4 key购买 nike

JSoup 非常新,试图检索存储在标签中的可变值,特别是从以下 website和html。
Snapshot of HTML
“consitituency/”之后的结果是可变的,取决于用户的输入。我能够自己检索 h2 标签,但不能检索其中的信息。目前我能得到的最好的返回只是使用下面的方法标记
期望的返回将是我可以分割的东西

Dublin Bay South


实际返回是

<well.col-md-4.h2></well.col-md-4.h2>

        private String jSoupTDRequest(String aLine1, String aLine3) throws IOException {
String constit = "";
String h2 = "h2";
String url = "https://www.whoismytd.com/search?utf8=✓&form-input="+aLine1+"%2C+"+aLine3+"+Ireland";
//Switch to try catch if time
Document doc = Jsoup.connect(url)
.timeout(6000).get();

//Scrape elements from relevant section

Elements body = doc.select("well.col-md-4.h2");
Element e = new Element("well.col-md-4.h2");
constit = e.toString();


return constit;
我对 JSoup 和一般抓取非常陌生。非常感谢知道自己在做什么的人的任何意见或尝试获得所需结果的任何替代方法

最佳答案

从相关部分代码中更改您的抓取元素,如下所示:

  • 选择第一个<div class="well">先说元素。
    Element tdsDiv = doc.select("div.well").first();
  • 选择第一个<a>下一个链接元素。此链接指向选区。
    Element constLink = tdsDiv.select("a").first();
  • 通过抓取此链接的文本内容来获取选区名称。
    constit = constLink.text();
  • 关于java - JSoup,如何从动态 <a href> 标记返回数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/68845528/

    24 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com