gpt4 book ai didi

python - 尝试从 BeautifulSoup 获取元素但可能被阻止

转载 作者:太空宇宙 更新时间:2023-11-03 19:41:21 25 4
gpt4 key购买 nike

我正在尝试检索 HTML 中列出的图表上的坐标。

网址:“http://www.worldacd.com/index

HTML:HTML

我已经做到了这一点:

import requests
from bs4 import BeautifulSoup

wacd_homepage = requests.get("http://www.worldacd.com/index")
wacd_homepage_soup = BeautifulSoup(wacd_homepage.content, "html.parser")

soup = wacd_homepage_soup.body.find("div", {"class":"container main"}).find("div", {"id":"content"}).find("div", {"class":"tab-content"}).find("div", {"class":"tab-pane active"}).find("div", {"class":"row"}).find("div",{"class":"span10"}).find("div",{"class":"wrapper"}).find("div",{"class":"chart"})
soup

结果只是一行:

<div class="chart" id="chart_index"></div>

没什么可看的。最终,我想进入如图所示的部分。 HTML 是否被部分阻止(不确定我在这里使用的术语是否正确)?

最佳答案

我发现“chart_index”元素用于谷歌图表库。您可以在“http://www.worldacd.com/index”的源代码中找到第860行

chart_index = new google.visualization.LineChart(document.getElementById('chart_index'));

我认为您可以使用解析 JS 检索图表上的坐标。

例如,

import requests
from bs4 import BeautifulSoup

wacd_homepage = requests.get("http://www.worldacd.com/index")
wacd_homepage_soup = BeautifulSoup(wacd_homepage.content, "html.parser")

soup = wacd_homepage_soup.find_all('script', {"type":"text/javascript"})
print(soup)

在“soup”的内容中,您可以在图表上找到坐标,例如“[new Date(2009, 1, 1), 98.55, 94.86, 96.25]”,每个“USD”、“EUR”和“CNY” .

关于python - 尝试从 BeautifulSoup 获取元素但可能被阻止,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60405602/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com