gpt4 book ai didi

python - 如何在抓取网站时绕过免责声明

转载 作者:行者123 更新时间:2023-12-01 02:50:27 25 4
gpt4 key购买 nike

出于工作原因,我在使用“driver = webdriver.PhantomJS()”之前能够抓取以下网站。我正在抓取的是价格和日期。

https://www.cash.ch/fonds/swisscanto-ast-avant-bvg-portfolio-45-p-19225268/swc/chf

由于我首先必须同意的免责声明页面,该功能在几天前​​停止工作。

https://www.cash.ch/fonds-investor-disclaimer?redirect=fonds/swisscanto-ast-avant-bvg-portfolio-45-p-19225268/swc/chf

一旦同意我就直观地看到了真实的内容,但是驱动程序似乎没有,打印出来的是[],所以它一定还是免责声明的url。

请参阅下面的代码。

    from selenium import webdriver
from bs4 import BeautifulSoup
import csv
import os

driver = webdriver.PhantomJS()
driver.set_window_size(1120, 550)

#Swisscanto
driver.get("https://www.cash.ch/fonds/swisscanto-ast-avant-bvg- portfolio-45-p-19225268/swc/chf")
s_swisscanto = BeautifulSoup(driver.page_source, 'lxml')
nav_sc = s_swisscanto.find_all('span', {"data-field-entry": "value"})
date_sc = s_swisscanto.find_all('span', {"data-field-entry": "datetime"})

print(nav_sc)
print(date_sc)
print("Done Swisscanton")

最佳答案

这应该可行(我认为您想在 zustimmen 中单击按钮?)

driver = webdriver.PhantomJS()
driver.get("https://www.cash.ch/fonds/swisscanto-ast-avant-bvg-portfolio-45-p-19225268/swc/chf"

accept_button = driver.find_element_by_link_text('zustimmen')
accept_button.click()

content = driver.page_source

更多详细信息请点击这里 python selenium click on button

关于python - 如何在抓取网站时绕过免责声明,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44865588/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com