python - 从位于网站的图表中解析表格项时遇到问题-6ren

python - 从位于网站的图表中解析表格项时遇到问题

转载作者：行者123 更新时间：2023-12-04 11:33:13

24

4

我正在尝试提取网页中图表上可用的表格内容。只有当有人将光标悬停在该区域内时，这些表格的内容才可见。一张这样的表是 this one .

Webpage address

表格所在的图表标题为 EPS consensus revisions : last 18 months .

到目前为止，我已经尝试过:

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

link = "https://www.marketscreener.com/SUNCORP-GROUP-LTD-6491453/revisions/"

driver = webdriver.Chrome()
driver.get(link)
wait = WebDriverWait(driver, 10)
for items in wait.until(EC.presence_of_all_elements_located((By.CSS_SELECTOR, "#graphRevisionBNAeec span > table tr"))):
    data = [item.text for item in items.find_elements_by_css_selector("td")]
    print(data)
driver.quit()

当我运行上面的脚本时，它会抛出错误 raise TimeoutException(message, screen, stacktrace):selenium.common.exceptions.TimeoutException: Message:指着这个 for items in wait.until()线。

来自多个表中的单个表的输出应如下所示:

Period: Thursday, Aug 22, 2019
Number of upgrading estimates: 0
Number of unchanged estimates: 7
Number of Downgrading estimates: 0
High Value: 0.90 AUD
Mean Value: 0.85 AUD
Low Value: 0.77 AUD

如何从该图中获取这些表格的内容？

EDIT: I'm still expecting any solution based purely on any browser simulator.

最佳答案

由于三个重要原因，直接查询网站的后端比使用 selenium 抓取前端要好得多:

速度 :直接使用 API 更快、更高效，因为它只获取您需要的数据，而不必等待 javascript 运行或像素渲染，并且没有运行 webdriver 的开销。

稳定性 :通常对前端的更改比对后端的更改更频繁且难以跟踪。如果您的代码依赖于站点的前端，那么当他们进行一些 UI 更改时，它可能会很快停止工作。

精度 : 有时 UI 中显示的数据不准确或不完整。例如，在本网站中，所有数字都四舍五入到小数点后两位，而后端有时会提供两倍多的准确数据。

以下是您可以轻松使用后端 API 的方法:

import requests
# API url found using chrome devtools
url = 'https://www.marketscreener.com/charting/afDataFeed.php?codeZB=6491453&t=eec&sub_t=bna&iLang=2'
# We are mocking a chrome browser because the API is blocking python requests apparently
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.100 Safari/537.36'}
# Make a request to the API and parse the JSON response
data = requests.get(url, headers=headers).json()[0]
# A function to find data for a specific date
def get_vals(date):
    vals = []
    for items in data:
        for item in items:
            if item['t'] == date:
                vals.append(item['y'])
                break
    return vals
# Use the function above with the example table given in the question
print(get_vals('Thursday, Aug 22, 2019'))

运行此输出列表 [0.9, 0.84678, 0.76628, 0, 7, 0] ，如您所见，这是您希望从您作为示例提供的表中提取的数据。

关于python - 从位于网站的图表中解析表格项时遇到问题，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57654639/

24

4

0

文章推荐： Dockerfile，如何从父目录复制文件

文章推荐： python - 具有每月偏移量的 Pandas 滚动()函数

文章推荐： r - 如何将字符向量转换为数字？

Jquery 图表/图表/绘图插件或创建生命之轮图的方法
按照目前的情况，这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持，但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit th
angular - 在轴中显示日期标签 - 图表 js/ng2 图表
需要在x轴的区间内显示日期标签。数据应保持不变，仅应根据快照显示日期间隔。对于 y 轴上的简单数字，可以使用“刻度”实现这一点 max: 5000,
IOS 图表 Y 轴未正确对齐 - 图表 Cocoa Pod
我目前正在使用 IOS 图表，该库的链接位于:Link 目前，图表左轴标签未代表其应有的内容。该图表当前已放大，以便可以平移。这是一张显示左轴的图片: 实际的数据集是: y值 = [0,2,4,5,
c# - 如何使用 ASP.NET 图表(MS 图表)显示 Y 值的特定范围
我是第一次使用 ASP.NET 图表，并取得了巨大的成功。我想做的一件事是放大我的图表，使 y 值不在 0-100 之间。例如，假设我有一些点值，范围从 72 到 89。我想做的是在 y 轴上将最低
javascript - Google 图表 - 在 x 和 y 标签上拉伸(stretch)图表
我正在使用 google graph 设计图表。我不需要 x 和 y 轴上的标签，所以我通过设置以下选项来隐藏它们: var options = { hAxis: { base
jQuery 图表
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的，因为
graphics - 如何从文本创建图片/图表？
Closed. This question does not meet Stack Overflow guidelines。它当前不接受答案。想改善这个问题吗？更新问题，以便将其作为on-topic
extjs - 图例模板 - 图表
我得到了这个模板(默认) {name} 产生这个: 我想拥有与它的每一个功能相同的模板。但是，我还需要一个 if 子句。如果一个项目的值为 0，我不希望它被“传奇化”。这是完整的代码 { xtype
excel - 执行Excel4Macro从关闭的工作簿中获取范围/图表
我使用这些行从关闭的工作簿中获取值: Arg = "'" & Path & "[" & File & "]" & Sheet & "'!" & "R4C4" Arg = CStr(Arg) GetV
Mercurial 提交图表/图表
就目前情况而言，这个问题不太适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持，但这个问题可能会引发辩论、争论、民意调查或扩展讨论。如果您觉得这个问题可以改进并可能重新开放，visit
带有文本数据范围的 Excel 图表
我有一张像这样的 table ________| S1 | S2|----------| a | b || b | c | -------- 我需要将其显示在散点图图表(或其他任何图表)上，其中
JavaFX 图表 - 图例之间的空间
这个问题已经有答案了: Fix spacing between different series in JavaFX line chart (1 个回答) 已关闭 4 年前。我有这个代码: publ
erlang - Erlang系统的设计图(图表)
我已经阅读了 4 个 erlang 的开源系统 3 个月了，它们是 rabbitmq、couchdb、gproc、jobs。它们和我以前的c#系统完全不同，因为有很多进程而且不是面向对象的。用设计
Java 图表 - 需要使用图表的自定义图像动态构建图表
我们希望使用我们设计的自定义图像动态创建图表。这将在 Java 1.5 Web 应用程序中使用。一个例子是显示代表男女比例的图表。我们希望图表是女性图标和男性图标的线性行，其中女性图标的数量将是女性的
具有自定义标准差的 Excel 图表
我有 2 列，一列包含我的数据点，另一列包含每个数据点的标准差。如何在 Excel 上绘制线图，其误差线等于每个点的透视标准差？例如 Col-1 Col-2 1 0.1 2 0
来自打印机的 Java 图表
我正在使用 JFreechart API 来生成“条形图”。我可以保存它们，但如何从 Java GUI 应用程序的打印机打印它们？最佳答案我在代码中使用以下代码片段。 IStatisticsGra
Excel 图表 - 动态设置系列结束
我有一个电子表格，其中包含大量图表，还有一张工作表，其中包含大量为这些图表提供数据的数据。我使用在每个图表上绘制了数据 =Sheet1!$C5:$C$3000 这基本上只是在图表上绘制 C5 到
Excel 图表 - 类别和子类别分组
我很少使用Excel，对图表和绘图相关函数没有深入的了解。话虽如此... 我有几十行数据，由 4 列组成第 1 列 = 金额/价格(以数字表示) 第 2 列 = 描述(内容正文) 第 3 列 = 类
iOS 图表 - 图表底部出现空白线
我正在使用 iOS-Charts，升级到 Swift3 后，我现在注意到图表底部有一个奇怪的空白区域，说明会出现在该空白区域。我尝试隐藏描述(将其设置为“”或启用= false)，但它仍然显示此差距。
带有实时数据的 C# 图表
我已经在评论中的以下链接之一中找到了一些使用实时数据绘制图表的示例。我现在的问题是，我还可以实时绘制图表标签、坐标轴和其他相关内容吗？其实我要找的是绘制实时数据的图表。通过搜索实时而非动态数据，我找

首页

博学

6Ren·AI

商城

python - 从位于网站的图表中解析表格项时遇到问题