gpt4 book ai didi

javascript - Selenium:在 JavaScript 调用时无需单击即可获取最终的 href/链接

转载 作者:行者123 更新时间:2023-12-03 02:10:37 39 4
gpt4 key购买 nike

我正在抓取一个长长的 html 链接表(ToS 允许)。但是,所有链接都是 javascript 调用 (href="javascript:;"),因此使用 get_attribute() 获取链接将不起作用。我不想真正点击所有链接,因为它会为每个链接下载一个大的 pdf 文件

是否可以获取所调用的最终 href/链接,而无需实际单击链接并下载文件?

谢谢!

最佳答案

是的,但并不容易 - 您需要查看这些链接之外的 javascript,可能这些链接是动态生成的。

这样做的想法<a href="javascript:;"></a>在这里描述 What does href expression <a href="javascript:;"></a> do?

简而言之:在 HTML 中为 <a>要正确渲染,您需要设置 href ,但有时没有直接链接或者以某种方式计算 - 因此您需要查看执行这些链接的 处理 的 javascript 代码 - 可能是一些 click您需要找到的事件监听器

关于javascript - Selenium:在 JavaScript 调用时无需单击即可获取最终的 href/链接,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49588021/

39 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com