python - 在 Python 中使用 Selenium 从部分可见的滚动框中抓取所有文本-6ren

python - 在 Python 中使用 Selenium 从部分可见的滚动框中抓取所有文本

转载作者：太空宇宙更新时间：2023-11-04 04:50:05

25

4

我正在尝试从公共(public)站点抓取数据 http://www.seaaroundus.org在 Python 中使用 selenium-webdriver。我正在尝试抓取 this 上列表选项的值使用以下代码的网页。该列表位于滚动框内并且部分可见。当我从 xpath 中提取文本时，它只返回列表中的前 11 项。有没有办法提取列表中所有项目的文本？我试图遍历不同项目的 xpath，但它们似乎在每第 11 个项目之后重复，因此循环中断。我必须为大约 300 个类似的网页执行此操作。将不胜感激任何线索! Screenshot here

import time
from selenium import webdriver

chrome_path = "C:\Program Files (x86)\chromedriver.exe"
driver = webdriver.Chrome(chrome_path)

#1 open website
driver.get("http://www.seaaroundus.org/data/#/eez/8/exploited-organisms")
time.sleep(5)

#xpath of where all the taxa names are listed
x_path = """//*[@id="exploited-organisms"]/sau-taxon-grid/div[2]/div[1]"""

#printing the xpath.text only prints the first 11 items
print(driver.find_element_by_xpath(x_path).text)

最佳答案

正如@Florent B. 正确建议的那样，您可以简单地使用对 API 的直接 HTTP 请求来获取所需的数据:

import requests
import json

url = 'http://api.seaaroundus.org/api/v1/eez/exploited-organisms/?region_id=8'

response = requests.get(url)

for fish in response.json()['data']:
    print("{} ({})".format(fish["common_name"], fish["scientific_name"]))

关于python - 在 Python 中使用 Selenium 从部分可见的滚动框中抓取所有文本，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/48547729/

25

4

0

文章推荐： html - 相对于直接亲属的绝对 DIV position().left？

文章推荐： python - 僵尸进程，我们又来了

文章推荐： c - 以编程方式查找缓存级别的数量

文章推荐： html - 中心和比例输入控件

typescript - A 部分部分 io-ts
我在使用 io-ts 时遇到一些问题。我发现它确实缺乏文档，我取得的大部分进展都是通过 GitHub issues 取得的。不，我不明白 HKT，所以没有帮助。基本上，我在其他地方创建一个类型，ty
java - 匹配完整文件正则表达式中的 A 部分，但不匹配 B 部分
我必须创建一个正则表达式来搜索整个文件，以找到与 Java XML 解析器的第一部分(但不是第二部分)的匹配项。这将用于防止某些 XXE 攻击。不幸的是，它确实必须是单个正则表达式，并且它确实需要搜索
c# - 部分/部分中的 asp.net mvs 部分？
我有一些简单的 Shared/_Header.cshtml 文件中的内容。 My Shared/_Layout.cshtml 通过调用插入该代码 @Html.Partial("_Header") 目前
java - Selenium 只执行循环的 if != null 部分，不运行循环的 "else if null "部分
我有一个 if-else 语句，其中: 条件 1:ID 匹配并且自动填充某些字段。然后 if 语句只填充其余字段条件 2:ID 不匹配，所有字段均为空白。 ELSE 语句将它们全部填充当我使条件
javascript - 无法在 JSFIDDLE 中使用滚动魔法(第 1 部分，共 2 部分)
我正在开发一个单页滚动网站。我正在尝试实现 ScrollMagic 并固定第一部分，以便网站的其余部分滚动到固定部分的顶部。我尝试创建一个 jsfiddle 来显示问题，但我似乎无法让 jsfiddl
javascript - 既然有

首页

博学

6Ren·AI

商城

python - 在 Python 中使用 Selenium 从部分可见的滚动框中抓取所有文本