gpt4 book ai didi

selenium - AWS Lambda 中的 Chrome Headless 返回空白页面

转载 作者:行者123 更新时间:2023-12-05 07:05:32 34 4
gpt4 key购买 nike

我正在使用 Chrome Headless(带有无服务器框架)在 AWS Lambda 函数中运行我的 selenium 抓取脚本。

from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from time import sleep

def main(event, context):
options = Options()
options.binary_location = '/opt/headless-chromium'
options.add_argument('--headless')
options.add_argument('--no-sandbox')
options.add_argument('--single-process')
options.add_argument('--disable-dev-shm-usage')
driver = webdriver.Chrome('/opt/chromedriver',chrome_options=options)

driver.get('https://www.linkedin.com/in/williamhgates')
sleep(2)
body = f"Headless Chrome Initialized, Page : {driver.page_source}"

driver.close()
driver.quit()

response = {
"statusCode": 200,
"body": body
}

return response

相同的脚本在我的本地 linux 机器上运行完美,返回了良好的源页面。但是当我通过 AWS Lambda 使用它时,它返回一个包含以下源代码的空页面:

<html xmlns=\"http://www.w3.org/1999/xhtml\"><head></head><body></body></html>

你有什么想法吗?提前谢谢你

最佳答案

这似乎是 SSL 证书的问题,设置所需的功能以忽略它

from selenium.webdriver.common.desired_capabilities import DesiredCapabilities


desired_capabilities = DesiredCapabilities.CHROME.copy()
desired_capabilities['acceptInsecureCerts'] = True

关于selenium - AWS Lambda 中的 Chrome Headless 返回空白页面,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62700862/

34 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com