selenium - 如何使用远程 selenium webdriver 下载文件？-6ren

selenium - 如何使用远程 selenium webdriver 下载文件？

转载作者：行者123 更新时间：2023-12-02 12:42:27

我正在使用远程selenium网络驱动程序来执行一些测试。然而，在某些时候，我需要下载文件并检查其内容。

我使用远程网络驱动程序如下(在python中):

PROXY = ...

prefs = {
    "profile.default_content_settings.popups":0,
    "download.prompt_for_download": "false",
    "download.default_directory": os.getcwd(),
}
chrome_options = Options()
chrome_options.add_argument("--disable-extensions")
chrome_options.add_experimental_option("prefs", prefs)

webdriver.DesiredCapabilities.CHROME['proxy'] = {
  "httpProxy":PROXY,
  "ftpProxy":PROXY,
  "sslProxy":PROXY,
  "noProxy":None,
  "proxyType":"MANUAL",
  "class":"org.openqa.selenium.Proxy",
  "autodetect":False
}
driver = webdriver.Remote(
        command_executor='http://aaa.bbb.ccc:4444/wd/hub',
        desired_capabilities=DesiredCapabilities.CHROME)

使用“普通”网络驱动程序，我可以在本地计算机上毫无问题地下载文件。然后我可以使用测试代码来例如验证下载文件的内容(可能会根据测试参数而变化)。这不是对下载本身的测试，但我需要一种方法来验证生成文件的内容...

但是如何使用远程网络驱动程序来做到这一点呢？我没有在任何地方找到任何有用的东西......

最佳答案

Selenium API 不提供将文件下载到远程计算机上的方法。

但是单独使用 Selenium 仍然是可能的，具体取决于浏览器。

使用 Chrome，可以通过导航 chrome://downloads/ 列出下载的文件并通过注入(inject) <input type="file"> 进行检索在页面中:

from selenium import webdriver
from selenium.webdriver.support.ui import WebDriverWait
import os, time, base64


def get_downloaded_files(driver):

  if not driver.current_url.startswith("chrome://downloads"):
    driver.get("chrome://downloads/")

  return driver.execute_script( \
    "return downloads.Manager.get().items_   "
    "  .filter(e => e.state === 'COMPLETE')  "
    "  .map(e => e.filePath || e.file_path); " )


def get_file_content(driver, path):

  elem = driver.execute_script( \
    "var input = window.document.createElement('INPUT'); "
    "input.setAttribute('type', 'file'); "
    "input.hidden = true; "
    "input.onchange = function (e) { e.stopPropagation() }; "
    "return window.document.documentElement.appendChild(input); " )

  elem._execute('sendKeysToElement', {'value': [ path ], 'text': path})

  result = driver.execute_async_script( \
    "var input = arguments[0], callback = arguments[1]; "
    "var reader = new FileReader(); "
    "reader.onload = function (ev) { callback(reader.result) }; "
    "reader.onerror = function (ex) { callback(ex.message) }; "
    "reader.readAsDataURL(input.files[0]); "
    "input.remove(); "
    , elem)

  if not result.startswith('data:') :
    raise Exception("Failed to get file content: %s" % result)

  return base64.b64decode(result[result.find('base64,') + 7:])



capabilities_chrome = { \
    'browserName': 'chrome',
    # 'proxy': { \
     # 'proxyType': 'manual',
     # 'sslProxy': '50.59.162.78:8088',
     # 'httpProxy': '50.59.162.78:8088'
    # },
    'goog:chromeOptions': { \
      'args': [
      ],
      'prefs': { \
        # 'download.default_directory': "",
        # 'download.directory_upgrade': True,
        'download.prompt_for_download': False,
        'plugins.always_open_pdf_externally': True,
        'safebrowsing_for_trusted_sources_enabled': False
      }
    }
  }

driver = webdriver.Chrome(desired_capabilities=capabilities_chrome)
#driver = webdriver.Remote('http://127.0.0.1:5555/wd/hub', capabilities_chrome)

# download a pdf file
driver.get("https://www.mozilla.org/en-US/foundation/documents")
driver.find_element_by_css_selector("[href$='.pdf']").click()

# list all the completed remote files (waits for at least one)
files = WebDriverWait(driver, 20, 1).until(get_downloaded_files)

# get the content of the first file remotely
content = get_file_content(driver, files[0])

# save the content in a local file in the working directory
with open(os.path.basename(files[0]), 'wb') as f:
  f.write(content)

使用 Firefox，可以通过切换上下文，通过脚本调用浏览器 API 来直接列出和检索文件:

from selenium import webdriver
from selenium.webdriver.support.ui import WebDriverWait
import os, time, base64

def get_file_names_moz(driver):
  driver.command_executor._commands["SET_CONTEXT"] = ("POST", "/session/$sessionId/moz/context")
  driver.execute("SET_CONTEXT", {"context": "chrome"})
  return driver.execute_async_script("""
    var { Downloads } = Components.utils.import('resource://gre/modules/Downloads.jsm', {});
    Downloads.getList(Downloads.ALL)
      .then(list => list.getAll())
      .then(entries => entries.filter(e => e.succeeded).map(e => e.target.path))
      .then(arguments[0]);
    """)
  driver.execute("SET_CONTEXT", {"context": "content"})

def get_file_content_moz(driver, path):
  driver.execute("SET_CONTEXT", {"context": "chrome"})
  result = driver.execute_async_script("""
    var { OS } = Cu.import("resource://gre/modules/osfile.jsm", {});
    OS.File.read(arguments[0]).then(function(data) {
      var base64 = Cc["@mozilla.org/scriptablebase64encoder;1"].getService(Ci.nsIScriptableBase64Encoder);
      var stream = Cc['@mozilla.org/io/arraybuffer-input-stream;1'].createInstance(Ci.nsIArrayBufferInputStream);
      stream.setData(data.buffer, 0, data.length);
      return base64.encodeToString(stream, data.length);
    }).then(arguments[1]);
    """, path)
  driver.execute("SET_CONTEXT", {"context": "content"})
  return base64.b64decode(result)

capabilities_moz = { \
    'browserName': 'firefox',
    'marionette': True,
    'acceptInsecureCerts': True,
    'moz:firefoxOptions': { \
      'args': [],
      'prefs': {
        # 'network.proxy.type': 1,
        # 'network.proxy.http': '12.157.129.35', 'network.proxy.http_port': 8080,
        # 'network.proxy.ssl':  '12.157.129.35', 'network.proxy.ssl_port':  8080,      
        'browser.download.dir': '',
        'browser.helperApps.neverAsk.saveToDisk': 'application/octet-stream,application/pdf', 
        'browser.download.useDownloadDir': True, 
        'browser.download.manager.showWhenStarting': False, 
        'browser.download.animateNotifications': False, 
        'browser.safebrowsing.downloads.enabled': False, 
        'browser.download.folderList': 2,
        'pdfjs.disabled': True
      }
    }
  }

# launch Firefox
# driver = webdriver.Firefox(capabilities=capabilities_moz)
driver = webdriver.Remote('http://127.0.0.1:5555/wd/hub', capabilities_moz)

# download a pdf file
driver.get("https://www.mozilla.org/en-US/foundation/documents")
driver.find_element_by_css_selector("[href$='.pdf']").click()

# list all the downloaded files (waits for at least one)
files = WebDriverWait(driver, 20, 1).until(get_file_names_moz)

# get the content of the last downloaded file
content = get_file_content_moz(driver, files[0])

# save the content in a local file in the working directory
with open(os.path.basename(files[0]), 'wb') as f:
  f.write(content)

关于selenium - 如何使用远程 selenium webdriver 下载文件？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/47068912/

文章推荐： kotlin 表达式自动转换时

文章推荐： java - 如何在 Spring Boot 2 中定义默认处理程序

文章推荐： java - 使用 JPA 和 Spring Boot 查询实体类型(鉴别器)

watir-webdriver - 如何将 Selenium-Webdriver 对象转换为 Watir-Webdriver
我想在 Watir webdriver 中使用 selenium webdriver Actions。这可能吗？也可以在 watir webdriver 中使用 java 代码。请帮忙。我浏览了很
webdriver - Watir-webdriver 黑色截图
我正在使用 watir-webdriver 浏览我的网站并在不同的浏览器中抓取屏幕截图。有时在 IE 中截取的屏幕截图大小合适，但颜色完全是黑色。同时运行的 Firefox 测试看起来很好。 bro
selenium-webdriver - webdriver 警告服务器未提供任何堆栈跟踪信息
我已经编写了 driver.findElement(By.id("kfiDocumentLink")).click(); 用于单击“KFI 文档”按钮的代码。请找到HTML代码。 Download
webdriver - Selenium WebDriver - 如何验证多行文本
我有一个包含以下内容的 html 页面: This is Login page. Please click below link
webdriver - Java WebDriver 等待页面加载
我想获得页面加载异常，但仍然没有结果。我使用implicitlyWait 设置计时器以抛出异常。 WebDriver driver = new FirefoxDriver(); driver.man
webdriver - Selenium WebDriver 有没有录像机？
我正在使用具有 IE 特定应用程序的 Selenium Webdriver。我知道我们可以截取执行的截图。同样，是否有任何选项可以将 selenium 执行记录为视频？最佳答案 WebDriver
webdriver - Selenium WebDriver 如何克服同源策略
Selenium WebDriver 如何克服同源策略？ Selenium RC 中存在同源策略问题最佳答案 First of all “Same Origin Policy” is introdu
webdriver - 从输入字段中提取文本 - 使用 Webdriver
我将如何从输入文件中提取文本？我尝试使用 XPath/CSSSelector 但我得到一个空文本，因为它是一个输入字段。这是我的 html 代码: 结果:195 行中的 1 到 50
webdriver - 使用 webdriver 自动验证码？
如何使用 WebDriver 自动验证码？是否有其他方法可以使用 Webdriver 自动执行验证码？最佳答案您只能使用“alt”属性中的显示验证码值来自动化验证码。在 WebElement
webdriver - WebDriver 中的动态元素 ID
最近我开始学习 WebDriver，因为我工作的客户计划使用 WebDriver 来自动化 Web 应用程序。我怀疑 WebDriver 如何在网页上定位其 ID 动态变化的元素(比如每次登录应用程
webdriver - watir-webdriver 在沉重的页面上通过正则表达式定位元素非常慢
我发现 watir-webdriver 在一个非常大的页面上通过正则表达式定位元素非常慢，至少在 FF 8.0.1 中对我来说是这样。航类搜索结果页面示例(包含大约 50 个搜索结果，每个都是 htm
selenium-webdriver - WebDriver:如何等待文本在元素中消失
我有一个动态更改其文本的字段。我需要一种方法来等待文本被更改。我不知道会出现什么文本，但我知道当前那里有什么文本。所以我想等待它在元素中消失。有办法吗？最佳答案你可以试试ExpectedCondi
selenium - 在 System.setProperty ("webdriver.gecko.driver", "")中， "Path to your WebDriver"是什么意思？
自从我使用 Firefox 升级到 3.0 beta 后，我就有了这个异常(exception)。 Exception in thread "main" java.lang.IllegalStateE
webdriver - Selenium webdriver C# - 获取整页截图
任何人都可以帮助我使用 Selenium webdriver 截取整页屏幕截图。我正在使用 c#/Nunit。我正在使用的当前方法不是完整的浏览器页面。我正在使用下面的代码截取屏幕截图。 publi
selenium-webdriver - 如何从 WebDriver 的本地缓存中保存图像？
我通过 WebDriver (Chrome) 从网页下载图像 // STEP 1 $driver->get($link); // STEP 2 $els=$driver->findElements(W
selenium-webdriver - Selenium WebDriver 的默认隐式等待值是什么？
Selenium WebDriver 的默认隐式等待值是什么？ selenium 文档说它是“0”，但是当我在一个全新的项目上调用 .findElement 时，DOM 上不存在元素，它似乎在一段时间
selenium-webdriver - 测试失败后 webdriver 的超时问题和陈旧实例
我正在使用 Webdriver 测试 Web 应用程序，大致如下所述。当测试通过时，一切都很好。但是，当其中一个测试失败时，我注意到以下 2 个问题。 a) 如果一个测试失败，则套件中的其余测试将超时
webdriver - 如何调试 Selenium WebDriver 操作？
我正在使用 Selenium WebDriver 并遇到问题。在 UI 中，WebDriver 可以看到元素，但无法执行任何操作，例如单击、键入、选择等。元素由 selenium 找到并作为 web
webdriver - 使用 WebDriver 处理 UntrustedSSLcertificates
我在 Java 中使用 Web 驱动程序处理 UntrustedSSLcertificates 时陷入困境。我创建了 Firefox 配置文件，如: FirefoxProfile profile =
webdriver - 使用 Selenium WebDriver 时如何知道我使用的浏览器类型？
选择的编程语言是 Java。我已经用 Java 编写了一个方法，我将 WebDriver 作为参数传递给它... public boolean myMethod(WebDriver webDriver

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

selenium - 如何使用远程 selenium webdriver 下载文件？