gpt4 book ai didi

excel - 使用网页抓取提取链接的问题

转载 作者:行者123 更新时间:2023-12-04 22:27:17 25 4
gpt4 key购买 nike

我想提取本网页所列玩具的链接:
https://cebra.com.ar/category/73/Juego-de-Construccion.html

我有一个完整的程序(我不在这里复制,因为它很长而且很复杂),其中在某些部分我有以下代码不起作用:

 Cells(erow, 1) = html.getElementsByTagName("a").href

有什么办法解决这个问题吗?

非常感谢!

最佳答案

getElementsByTagName返回一个集合,实际上您需要对其进行索引以获取特定元素。

但是,您不希望所有 a标签。这是低效的,您需要额外的测试来限制那些感兴趣的测试。您特别想要产品的链接,所以使用 attribute = value css selector得到那些:

Dim links As Object, i As Long
Set links = html.querySelectorAll("[href^=product]")

For i = 0 to links.Length - 1
ActiveSheet.Cells(erow + i, 1) = links.item(i).href
Next

这个:
[href^=product]

寻找 href值以 ^, product 开头的属性.

如果您查看页面 html,您可以看到每个目标链接都以该子字符串开头

enter image description here

关于excel - 使用网页抓取提取链接的问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56638088/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com