gpt4 book ai didi

java - 如何使用 Jsoup 从 html 检索数据

转载 作者:行者123 更新时间:2023-12-02 02:41:47 25 4
gpt4 key购买 nike

我是 HTML 新手,我正在尝试通过尝试从 HTML 字符串检索数据来了解一些有关 HTML 标记的知识。

<li> 
<div class="item" data-youtube_code="code_for_youtuber" data-feature_code="data" data-feature_url="/movies/Truman">
<div class="title">
<span>the title of the video</span>
</div>
<div class="image">
<img src="/media/image.png" data-src="http://url_of_image.jpg" alt="">
</div>
</div> </li>

我正在使用 Java Jsoup 库,到目前为止我已经成功提取 <span>内容使用:

    Document doc = Jsoup.connect("http://www.yesplanet.co.il/movies").get();
System.out.println(doc.html());
Elements elem = doc.select(".item").text();

我怎样才能获得其他东西,例如data-youtube_codeimg src .

编辑:例如:

System.out.println("doc...data-youtube_code");//some code that retrieves 
//data-youtube_code. The ouptup will be "code_for_youtuber"

System.out.println("data-src")
//some code that retrieves
//data-src. The ouptup will be "http://url_of_image.jpg"

最佳答案

您只需选择第一个 div 并按属性获取值

    Element elements = Jsoup.parse(s).select("div").first();
System.out.println(elements.attr("data-youtube_code"));

输出:

code_for_youtuber

编辑:

Element elements = Jsoup.parse(s).select(".item").first();
System.out.println(elements.attr("data-youtube_code"));
Element element1 = elements.select(".image img").first();
System.out.println(element1.attr("data-src"));

输出:

code_for_youtuber
http://url_of_image.jpg

由于您是初学者,我建议您寻找这个link

关于java - 如何使用 Jsoup 从 html 检索数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45342088/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com