python - 在 python 中使用 selenium 进行分页导航-6ren

python - 在 python 中使用 selenium 进行分页导航

转载作者：行者123 更新时间：2023-12-03 19:26:01

29

4

我正在使用 Python 和 Selenium 抓取这个网站。我有代码工作，但它目前只刮第一页，我想遍历所有页面并将它们全部刮掉，但它们以一种奇怪的方式处理分页我将如何浏览页面并逐个刮掉它们？

分页 HTML:

<div class="pagination">
    <a href="/PlanningGIS/LLPG/WeeklyList/41826123,1" title="Go to first page">First</a>
    <a href="/PlanningGIS/LLPG/WeeklyList/41826123,1" title="Go to previous page">Prev</a>
    <a href="/PlanningGIS/LLPG/WeeklyList/41826123,1" title="Go to page 1">1</a>
    <span class="current">2</span>
    <a href="/PlanningGIS/LLPG/WeeklyList/41826123,3" title="Go to page 3">3</a>
    <a href="/PlanningGIS/LLPG/WeeklyList/41826123,4" title="Go to page 4">4</a>
    <a href="/PlanningGIS/LLPG/WeeklyList/41826123,3" title="Go to next page">Next</a>
    <a href="/PlanningGIS/LLPG/WeeklyList/41826123,4" title="Go to last page">Last</a>
</div>

刮刀:

import re
import json
import requests
from selenium import webdriver
from selenium.webdriver.support.ui import Select
from selenium.webdriver.chrome.options import Options

options = Options()
# options.add_argument('--headless')
options.add_argument("start-maximized")
options.add_argument('disable-infobars')
driver=webdriver.Chrome(chrome_options=options, 
executable_path=r'/Users/weaabduljamac/Downloads/chromedriver')

url = 'https://services.wiltshire.gov.uk/PlanningGIS/LLPG/WeeklyList'
driver.get(url)

def getData():
  data = []
  rows = driver.find_element_by_xpath('//*[@id="form1"]/table/tbody').find_elements_by_tag_name('tr')
 for row in rows:
    app_number = row.find_elements_by_tag_name('td')[1].text
    address =  row.find_elements_by_tag_name('td')[2].text
    proposals =  row.find_elements_by_tag_name('td')[3].text
    status =  row.find_elements_by_tag_name('td')[4].text
    data.append({"CaseRef": app_number, "address": address, "proposals": proposals, "status": status})
print(data)
return data


def main():
 all_data = []
 select = Select(driver.find_element_by_xpath("//select[@class='formitem' and @id='selWeek']"))
 list_options = select.options

 for item in range(len(list_options)):
    select = Select(driver.find_element_by_xpath("//select[@class='formitem' and @id='selWeek']"))
    select.select_by_index(str(item))
    driver.find_element_by_css_selector("input.formbutton#csbtnSearch").click()
    all_data.extend( getData() )
    driver.find_element_by_xpath('//*[@id="form1"]/div[3]/a[4]').click()
    driver.get(url)

 with open( 'wiltshire.json', 'w+' ) as f:
    json.dump( all_data, f )
 driver.quit()


if __name__ == "__main__":
    main()

最佳答案

首先获取分页中的总页数，使用

ins.get('https://services.wiltshire.gov.uk/PlanningGIS/LLPG/WeeklyList/10702380,1')
ins.find_element_by_class_name("pagination")
source = BeautifulSoup(ins.page_source)
div = source.find_all('div', {'class':'pagination'})
all_as = div[0].find_all('a')
total = 0

for i in range(len(all_as)):
    if 'Next' in all_as[i].text:
        total = all_as[i-1].text
        break

现在只需遍历范围

for i in range(total):
 ins.get('https://services.wiltshire.gov.uk/PlanningGIS/LLPG/WeeklyList/10702380,{}'.format(count))

不断增加计数并获取页面的源代码，然后获取它的数据。
注意:单击从一页转到另一页时不要忘记 sleep

关于python - 在 python 中使用 selenium 进行分页导航，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/51743859/

29

4

0

文章推荐： delphi - 在项目中使用包

文章推荐： html - 如何告诉 Outlook 图像文件在哪里？

文章推荐： sql - Delphi 2007 Adoquery参数不起作用

javascript - 带有嵌套 ionic 导航 View 的 ionic 导航 View 不起作用
ion-nav-view 嵌套有一个奇怪的问题。当我在浏览器中加载应用程序时，我可以看到 URL 正在更改为 /app/menu，但页面上没有出现 menu.html 中的内容。页面是空白的。以下是
BootStrap笔记-导航
运行截图如下：源码如下： CN_TEST1
ReactJS 导航
我正在开发一个示例reactjs应用程序(在学习过程中)。我有一个页面，其中列出了用户列表和一个用于添加新用户的添加按钮。当我单击添加按钮时，我应该导航到用户表单以创建新用户。单击用户表单中的提交
CSS - 导航
我的导航栏中的导航链接有问题。首先，它没有在导航栏中间对齐，如下所示: 另一部分是，我正在使用填充来执行此操作，因此如果我放置除“测试”以外的任何内容或将其放在不同的情况下，等等。它会重复该框。代码预
JavaScript 导航
基本上，我有一个网站，我正在尝试使用 ajax 导航构建它，以便它获取网页并将它们加载到同一页面中。问题是当我正常放入内容时它工作正常但是当我尝试将内容添加到外部文档并从导航中访问它时框拆分你可以在这
CSS 导航？
以下站点左侧菜单的导航使用 CSS 进行鼠标悬停链接。 PVH 当我获取导航代码并将其设为单独的页面时。然后鼠标悬停链接不起作用。可能是什么原因？ Test 最佳答案可能... 对此事有话要说
用双栈实现 Web 导航
一问题描述标准的 Web 浏览器包含在最近访问过的页面中向后和向前移动的功能。实现这些特性的一种方法是使用双栈来跟踪前后移动可以到达的页面。 Web 导航支持下面的命令。后退页面：将当前页面推到
命令按钮上的 JSF 导航
我想有条件地导航到某个页面。如果某些条件为真，我想导航到其他页面，否则我想留在同一页面上。我有类似的东西:- 在 bean.navigate 我有类似的东西:- public String navi
通过按钮的 WPF 导航
问题:有没有办法让按钮在用户控件中表现得像超链接？我已经搜索了几天，但没有找到解决此问题的人。如何使用按钮在 WPF 应用程序中导航？具体来说，如何使用户控件内的按钮在其主机框架中导航？请记住，用户
Android 导航 popBackStack
我尝试使用 Android Navigation 组件并遇到了回栈问题。我有 fragment A，B。我写的: Navigation.findNavController(view).naviga
symfony - 导航，突出显示当前页面
我有一个父布局，并从该子站点派生而来。父级布局具有一个导航，每个导航点代表一个子站点。如何在父布局中突出显示当前查看的子站点？如果看起来如何？最佳答案可能不是最好的选择，但这是基于路由名称的
c# - 在发生之前拦截Blazor服务器端路由/导航
我正在开发Blazor服务器端应用程序。熟悉Blazor的任何人都在左侧的NavBar中填充超链接，并以特殊的CSS类进行装饰。我的问题是，如果任何内容都已编辑，我将试图停止导航并在一个特定页面上显示
Flutter 导航，重新打开页面而不是再次推送
我是 flutter 的新手，我正在开发一个具有多个屏幕的应用程序。我想知道如何阻止 flutter 创建同一路线的多个屏幕，例如我有第1页和第2页，如果我单击按钮导航到第 2 页并再次单击
屏幕上的 MvvmCross 导航
我们的设计师创建了一个类似于上面屏幕的布局。主要思想是创建一个只有一个屏幕的应用程序，当您点击一个按钮时，屏幕的红色部分会发生变化(即 2 个文本框而不是 1 个文本框)。这个应用程序将是一个多平台应
flutter - flutter 导航
有人可以解释为什么从pageE返回时不打印efeioi吗？页面A Navigator.pushNamed(context, PageB.ROUTE).then((onValue) {
带有侧边菜单的 iOS 导航
我需要在 iOS 应用程序中创建一个导航，如下图所示。它包含一个标签栏和一个侧边菜单。问题是正确的导航菜单按钮，应该在所有选项卡中都可见。甚至每个选项卡的所有内部屏幕。当用户从侧面菜单中选择一个
很长的行的 vim 导航
这个问题在这里已经有了答案: Vim: move around quickly inside of long line (8 个答案) 关闭 8 年前。我正在用 vim 编辑一个文本文件，我已经使
java - 如何在谷歌地图上创建从用户位置到用户选择的项目覆盖的路线/导航？
我很困惑，如何执行操作来创建从用户位置到用户选择/点击图钉覆盖层的图钉覆盖层(谷歌位置)的路线/导航。这是我的 map Activity ，它将显示我的 map 。 public class Plac
jQuery Animate - 导航
我正在使用 jQuery 函数 .animate 来一一突出显示导航链接。他们在 ul 中。我可以让它工作，只是想知道是否有一种方法可以缩短我的代码，这样我就不必单独突出显示每个项目。提前致谢 $(d
JavaScript anchor 导航
我正在创建一个带有“ anchor 导航”的网站，就像 Facebook 和谷歌邮件一样。我已经让它工作了，但还不完全。当我加载带有 #contact 之类的页面时，除非我单击它的链接，否则它不会加载

首页

博学

6Ren·AI

商城

python - 在 python 中使用 selenium 进行分页导航