gpt4 book ai didi

Python: Selenium with PhantomJS 空页面源码

转载 作者:太空宇宙 更新时间:2023-11-03 14:48:25 25 4
gpt4 key购买 nike

当我想获取 URL 页面的源时,我在 Windows7 上使用 Selenium 和 PhantomJS 时遇到问题。 browser.page_source仅返回 <html><head></head></html> .我之前睡过browser.page_source但它没有帮助。

这是我的代码:

from selenium import webdriver
browser = webdriver.PhantomJS('phantomjs-1.9.7-windows\phantomjs.exe')
url = 'myurl'
browser.get(url)
print browser.page_source

在具有相同版本 PhantomJS 的 Linux 上,它可以完美运行。它也适用于 Windows Server 2003。

最佳答案

默认情况下,phantomjs 使用 SSLv3,但许多网站在 ssl 出现错误后迁移到 tls。这就是为什么你有空白页。使用 service_args=['--ignore-ssl-errors=true', '--ssl-protocol=any']

browser = webdriver.PhantomJS('phantomjs-1.9.7-windows\phantomjs.exe', service_args=['--ignore-ssl-errors=true', '--ssl-protocol=any'])

关于Python: Selenium with PhantomJS 空页面源码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36626710/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com