gpt4 book ai didi

python - 如何在 python 中使用 selenium 在动态 href 链接上进行循环?

转载 作者:太空宇宙 更新时间:2023-11-03 21:03:07 25 4
gpt4 key购买 nike

我想在动态 href 上进行循环。事实上,我每页下载一组文件。在每个页面上,我下载 100 个文本文件,但我必须下载 200 000 个文件。所以,我必须在2000年单击下一个按钮。为此,我获得了下一个按钮的href地址,但不幸的是,此链接中的两个对象发生了变化,页码1,2,3等以及一串人物。请参阅随附的下一个更改按钮的示例。

https://search.proquest.com/something/E6981FD6D11F45E8PQ/2?accountid=12543#scrollTo

https://search.proquest.com/something/E6981FD6D11F45E8PQ/3?accountid=12543#scrollTo

https://search.proquest.com/something/61C27022597C4092PQ/4?accountid=12543#scrollTo

https://search.proquest.com/something/E431552DC6554BF7PQ/5?accountid=12543#scrollTo

我是 Python 的新用户。我的水平很差。

#Before I add selenium setup for scraping. 

n=2000

for i in range(1,n):
href="https://search.proquest.com/something/715376F5A5AF44BBPQ/" + str(i) + "?accountid=12543#scrollTo"
driver.get(href)

#Here, I add the code which allows downloading for each page.

最佳答案

示例链接对我来说不可用(我无法注册)

首先..

what is "string of chacracters"?

书号?或类别号?

如果它只是随机字符串,我认为你应该找到另一种方法。

使用 ActionChain 怎么样? ?或driver.execute_script()

首先,在我看来,找到字符串的含义(来自.js或.html)更重要。

关于python - 如何在 python 中使用 selenium 在动态 href 链接上进行循环?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55602056/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com