gpt4 book ai didi

headless 模式的docker容器中的python selenium + geckodriver无法滚动页面

转载 作者:太空宇宙 更新时间:2023-11-03 21:07:12 25 4
gpt4 key购买 nike

我正在尝试在 docker 容器 ubuntu 18.04 中以 headless 模式使用 geckodriver 运行 selenium。这是我的代码:

    while True:
driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")

time.sleep(2)
newHeight = driver.execute_script("return document.body.scrollHeight")
print('scrolling..')
if newHeight == lastHeight:
print(f'scrolling done..')
list_of_images = driver.find_elements_by_css_selector('._2eea a')
print(f'collecting: {fp_url}')
images = []
for image in list_of_images:
url = image.get_attribute('href')
if 'type=3' in str(url):
print(f'append: {url}')
images.append(url)
# clear_memory()
print(f'total: {len(images)} memes')
count = 1
else:
lastHeight = newHeight

当我在本地计算机中尝试时,没有出现错误,但当我在 Docker 容器中尝试时,页面似乎无法滚动。这是我的驱动程序设置:

    options = webdriver.FirefoxOptions()
options.add_argument('--hide-scrollbars')
options.add_argument('--disable-gpu')
options.add_argument('-headless')
driver = webdriver.Firefox(firefox_options=options, executable_path=os.path.join(os.getcwd(), "geckodriver"))

最佳答案

假设您的 Chrome 驱动程序完全是最新的,但值得检查

https://sites.google.com/a/chromium.org/chromedriver/downloads

也许尝试几种不同的滚动方式可以产生更好的结果:)

使用操作链 - https://selenium-python.readthedocs.io/api.html

from selenium.webdriver.common.action_chains import ActionChains as AC

ele = driver.find_element_by_id("myID")

actions = AC(driver)
actions.move_to_element(ele).perform()

将元素 id 作为参数传递给scrollintoview()

driver.execute_script("arguments[0].scrollIntoView();", ele)

关于 headless 模式的docker容器中的python selenium + geckodriver无法滚动页面,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55322872/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com