gpt4 book ai didi

javascript - 在自动脚本中从网站检索 zip 文件

转载 作者:行者123 更新时间:2023-12-04 16:21:53 26 4
gpt4 key购买 nike

供引用:http://wogcc.state.wy.us/urecordsMenu.cfm?Skip=%27Y%27&oops=ID14447

我正在尝试从没有专用 url 的 zip 文件中检索。我在 Python Mechanize 和漂亮的汤方面做得很好,但在接近过程结束时遇到了问题。

在表格中选择我想要的选项后(通过 mechanize/bs4),然后我尝试让我的浏览器“提交”表单并检索我的 zip 文件。然而,“提交”按钮只是一个带有

onclick="javascript:submit()" 

称呼。当您在浏览器中手动点击该按钮时,它会将您重定向到一个通用的“.....testdwn.cfm?RequestTimeout=2000”页面,无论您在单击 gif 图像之前选择哪个选项(也会下载您的 zip文件)。所以我的问题是没有专用的 zip url。

因此,从过去几天我在网上阅读的内容来看,Python/Mechanize 无法以任何方式读取 javascript,因此我似乎是该途径的 SOL。如果 Mechanize 能以某种方式点击那个按钮,一切都会好起来的。

我应该采用什么方法来拉取这些数据?我已经阅读了有关 selenium 的内容,但我想知道哪种选项绝对是最简单和最好的提取这些数据的选项,基于 javascipt 或基于 python-selenium,还是其他什么?如果可以管理 Python 是首选。

提前致谢!

最佳答案

好的,我使用 Selenium 找到了答案,

import selenium
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.common.action_chains import ActionChains


driver = webdriver.Chrome(executable_path=r"C:\Users\xx\xx\xx\xx\xx\xx\chromedriver.exe")
driver.get("http://wogcc.state.wy.us/urecordsMenu.cfm?Skip=%27Y%27&oops=ID14447")
assert "Download Menu" in driver.title
form = driver.find_element_by_xpath("/html/body/table[2]/tbody/tr[7]/td/form/table[1]/tbody/tr[3]/td[2]/select/option[37]")
submit = driver.find_element_by_xpath("/html/body/table[2]/tbody/tr[7]/td/form/table[1]/tbody/tr[3]/td[1]/font/img")

ActionChains(driver).move_to_element(form).click(form).perform()
ActionChains(driver).move_to_element(submit).click(submit).perform()

我导航到该页面并使用 Selenium 的 find_element_by_path 及其 ActionChains 来选择并单击我想要的所有内容

关于javascript - 在自动脚本中从网站检索 zip 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27865614/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com