gpt4 book ai didi

python-3.x - 如何使用 BS 或 selenium 从 gchart 中抓取数据

转载 作者:行者123 更新时间:2023-12-02 18:47:24 24 4
gpt4 key购买 nike

我希望从图表中提取数据,当您将鼠标悬停在图表上时可以查看该数据,但该数据不会出现在源代码中。有什么办法可以提取这个吗?我对此很陌生,但到目前为止还没有在任何地方找到对此的讨论。这似乎是 Selenium 的工作,或者可能是我从未听说过的很酷的东西。

下面的代码涉及大麻素部分,这是我感兴趣的领域,以及具有相同问题的萜烯部分。

https://www.dinafem.org/en/amnesia-cbd/

<div id="product-cannabinoids-chart-wrapper"> <div data-chart_id="product_cannabinoids" class="auto-gchart" id="product_cannabinoids_chart"></div> </div> <form data-chart_id="product_cannabinoids" class="auto-gchart-filters" style="display: none;"> <input type="hidden" name="product_sku" value="0003142"/> </form>

最佳答案

这些表来自 POST 请求。您可以使用纯请求来模仿这一点。

方法如下:

import json

import requests
from bs4 import BeautifulSoup

url = "https://www.dinafem.org/en/amnesia-cbd/?PageSpeed=noscript"

headers = {
"User-Agent": "Mozilla/5.0 (X11; Linux x86_64) "
"AppleWebKit/537.36 (KHTML, like Gecko) "
"Chrome/90.0.4430.85 Safari/537.36",
"X-Requested-With": "XMLHttpRequest"
}

with requests.Session() as connection:
product_sku = BeautifulSoup(
connection.get(url).text,
"html.parser",
).find("input", {"name": "product_sku"})["value"]

chart_ids = ["product_cannabinoids", "product_terpenes"]

payload = {
"action": "get_gchart_data",
"filters": f"product_sku={product_sku}",
}

charts = []
for chart_id in chart_ids:
payload.update({"chart_id": chart_id})
charts.append(connection.post(url, headers=headers, data=payload).json())

print(json.dumps(charts[0], indent=2))

输出:

{
"error": 0,
"chart_id": "product_cannabinoids",
"data": [
[
"Cannabinoid",
"(%)"
],
[
"CBD",
11.64
],
[
"THC",
7.37
],
[
"CBC",
0.7
],
[
"CBG",
0.46
],
[
"THCV",
0.04
],
[
"CBN",
0.01
]
],
"debug": {
"total": 20.220000000000002
}
}

您甚至可以绘制该图以获得网站上的真实图表。

将其添加到您的导入中:

import matplotlib.pyplot as plt

然后输入:

data = [i[1] for i in charts[1]["data"]]
info = [i[0] for i in charts[1]["data"]]
fig = plt.figure(figsize=(10, 7))
plt.pie(data, labels=info)
plt.show()

要得到这个:

enter image description here

关于python-3.x - 如何使用 BS 或 selenium 从 gchart 中抓取数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/67254837/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com