gpt4 book ai didi

Xpath 到 import.io 的 url

转载 作者:行者123 更新时间:2023-12-03 15:47:34 25 4
gpt4 key购买 nike

我正在获取此站点上提供的职位列表:http://telekom.jobs/global-careers

我正在尝试获取链接的 XPath 以获取有关工作的更多信息。

这是第一个链接的完整 XPath:

/html/body/div[3]/div/div[2]/div[3]/table/tbody/tr[2]/td/div/a/@href

这是我应该粘贴到 import.io 的内容:

tr[2]/td/div/a/@href

但是它不起作用,我不知道为什么。

有关工作机会页面的更多信息的链接具有 XPath:

tr[2]/td/div/a/@href
tr[4]/td/div/a/@href
tr[6]/td/div/a/@href
tr[8]/td/div/a/@href

等等。也许这就是它不起作用的原因?因为数字不是 1、2、3 等而是 2、4、6?还是我做错了什么?

最佳答案

如果您从 URL 2.0 创建一个 API 并在打开 JS 但关闭 CSS 的情况下重新加载网站,您应该能够看到可折叠菜单:

在这个网站上,DOM 的构造方式是所有奇数行都有职位名称,而有关该职位的更多信息隐藏在偶数行中。为此,我们可以使用 XPath 的 position() 属性,因此您可以在手动行训练中使用以下 XPath:

/html/body/div[3]/div/div[2]/div[3]/table/tbody/tr[position() mod 2 = 0]

其中突出显示了更多信息框,只允许您访问其中的数据。从这里您可以简单地定位具有可用标题和链接的元素的特定属性。

链接 xpath: .//a[@class='forward jobadview']/@href标题xpath: .//div[@class='info']//h3

话虽如此,由于网站大量使用JS,可能会出现无法发布的情况,因此我们创建了一个API供您查询,您可以在此处使用它来检索相同的数据。

https://import.io/data/mine/?id=0626d49d-5233-469d-9429-707f73f1757a

关于Xpath 到 import.io 的 url,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27827730/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com