gpt4 book ai didi

java - 我在用Java解析网页时遇到了问题

转载 作者:行者123 更新时间:2023-12-01 19:14:52 24 4
gpt4 key购买 nike

我想解析 Google Play 上的一些网页(例如 this )以获取游戏的当前版本、总下载量等。我不是 Java 新手,但在解析方面有点新手。我听说过一些有关 JSOUP 库的信息并尝试处理它,但遇到了问题。

似乎 Google Play 没有提供正确的 HTML 文档(页面源代码有点清晰)。我认为最初页面正在加载,只有在使用 JS 之后,数据才会加载到页面上。 div/span 类具有相同的名称,我得到如下内容:

<span class="htlgb">December 16, 2019</span>
<span class="htlgb">20M</span>
<span class="htlgb">100,000+</span>
<span class="htlgb">1.5.7</span>
<span class="htlgb">4.0 and up</span>

怎么玩这个?有小费吗?我可以用JSOUP解决这个问题吗?

最佳答案

您必须使您的解析器与站点保持同步。目前,您必须假设具有该类名称的第一个 span 是日期,第二个 span 是 View ,第三个 span 是安装等。您可以获取带有 htlgb 类的 span 元素列表,并根据它们的索引来识别它们。

但是,如果您做出一些其他假设,您可以更加确定。例如,您可以知道哪个 span 是日期,因为它的文本将包含月份(即 12 月)。

关于java - 我在用Java解析网页时遇到了问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59429737/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com