gpt4 book ai didi

java - 无法获取某种使用 jsoup 解析 HTML 页面的链接

转载 作者:行者123 更新时间:2023-12-01 19:03:26 34 4
gpt4 key购买 nike

鉴于此链接:

http://www.argenteam.net/movie/40749/American.Reunion.%282012%29

我正在尝试使用 jsoup 获取该页面上的所有此类链接:

<a href="ed2k://|file|American.Reunion.UNRATED.DVDRip.XviD.CD1-COCAIN.avi|734205866|C92C5188830C4F740C69521F67337A45|h=Z5F72XEXRGGXBCMSOR6NS3IBCTFIHQLL|/">CD1</a>

问题是我无法获得此类链接。做了一些极端的事情,我尝试了以下代码来获取页面上的所有链接,但同样,这个“a[href]”不存在于列表中。

doc = Jsoup.connect("http://www.******.net/movie/40749/American.Reunion.%282012%29").get();

Elements ed2k = doc.select("a[href]");
for (Element emule:ed2k){
String mula = emule.attr("href");
}

如何获取以值“ed2k”开头的所有链接?它们位于 CSS“div.pmovie div.releases div.release-info div.section div.links div a”上,但我不知道问题是什么,它们对于我的实现来说是“不可见的”。如果您查看源 HTML 代码,您会发现它似乎并不奇怪,并且所有浏览器都可以很好地管理此类链接。那么,为什么我没有使用 jsoup 和 css 选择器来解析它们呢?我需要使用节点和兄弟节点吗?

提前致谢。

最终编辑解决方案:

该网站正在请求 cookie 来显示我需要的链接,因为该 cookie 仅使用真实浏览器生成,因此 Jsoup 无法检索所有信息,并且它连接到真实页面的简化版本。在 Jsoup 连接中发送特定的 cookie 解决了这个问题。示例:

doc = Jsoup.connect(your url here).cookie(cookie name, cookie value).get();

最佳答案

我在您指定的网址来源中没有看到任何此类链接。

通常,您可以使用以下属性值选择语法来完成您所要求的操作:

[attr^=valPrefix] 
elements with an attribute named "attr", and value starting with "valPrefix"
Example: a[href^=http:]

(来自 http://jsoup.org/apidocs/org/jsoup/select/Selector.html )

关于java - 无法获取某种使用 jsoup 解析 HTML 页面的链接,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11285518/

34 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com