gpt4 book ai didi

在 Firefox 中下载 PDF 的 Selenium 问题

转载 作者:行者123 更新时间:2023-12-05 06:30:37 30 4
gpt4 key购买 nike

我正在努力将我们的内部 Java Selenium 框架与 Firefox 61.0 和 Geckodriver 0.21.0 结合升级到最新版本 3.14.0。

当涉及到使用 Firefox 自动下载 PDF 文件时,我遇到了问题。例如在这个 link有一个下载按钮,我可以让 Selenium 执行点击。将打开一个内置查看器,而不是下载 pdf。首选项 pdfjs.disabled 应该停用查看器,因此使用配置文件创建了驱动程序实例(并尝试了更多首选项)。

FirefoxProfile firefoxProfile = new FirefoxProfile();
firefoxProfile.setAcceptUntrustedCertificates(true);
firefoxProfile.setAssumeUntrustedCertificateIssuer(true);
firefoxProfile.setPreference("browser.download.folderList", 2);
firefoxProfile.setPreference("network.cookie.cookieBehavior", 0);
firefoxProfile.setPreference("network.cookie.alwaysAcceptSessionCookies", true);
firefoxProfile.setPreference("browser.helperApps.neverAsk.saveToDisk", "application/pdf");
firefoxProfile.setPreference("browser.helperApps.neverAsk.openFile", "application/pdf");
firefoxProfile.setPreference("browser.helperApps.alwaysAsk.force", false);
firefoxProfile.setPreference("browser.download.manager.showAlertOnComplete", false);
firefoxProfile.setPreference("browser.download.manager.showWhenStarting", false);
firefoxProfile.setPreference("browser.download.panel.shown", false);
firefoxProfile.setPreference("browser.download.manager.focusWhenStarting", false);
firefoxProfile.setPreference("browser.download.manager.closeWhenDone", false);
firefoxProfile.setPreference("browser.download.manager.useWindow", false);
firefoxProfile.setPreference("services.sync.prefs.sync.browser.download.manager.showWhenStarting", false);
firefoxProfile.setPreference("browser.download.manager.alertOnEXEOpen", false);
firefoxProfile.setPreference("pdfjs.disabled", true);

FirefoxOptions firefoxOptions = new FirefoxOptions();
firefoxOptions.setProfile(firefoxProfile);
WebDriver webdriver = new FirefoxDriver(firefoxOptions);

不幸的是,对于使用过的 Firefox 版本,此配置无效。除非您在运行时在 about:config 页面中将 pdfjs.disabled 更改为 true。只有在运行时首次更改时,pdf 查看器才真正被禁用。似乎是 Firefox 中的错误。好的,无论如何,我找到了一种在运行时使用 selenium 更改它的方法。

但现在 pdf 查看器被跳过另一个 popup正在中断下载。 Selenium 甚至不知道这个弹出窗口。

在首选项页面 about:preferencesApplications我现在可以看到,对于内容类型 PDF 文档,Action 已更改为无,这似乎与 Always ask 相同。之前是 Preview in Firefox 但它必须是 Save File 才能达到我的目标,即立即毫无疑问地下载 PDF。

如果没有单一的配置,您可以将其更改为“保存文件”。我错了吗?但是当我检查配置文件文件夹的差异时,我发现有一个 handlers.json 包含上图中的设置。它在浏览器启动期间被读入,并在浏览器关闭时首先适应。
通常 selenium 会为每个新的浏览器实例创建一个新的临时配置文件文件夹。如果我想影响所需的设置,我需要定义自定义配置文件。那是我的想法。所以我尝试了这个:

firefoxOptions.addArguments("-profile", "/tmp/my.profile");

我认为这是正确的,但现在又出现了另一个问题...因为虽然 Firefox 在给定目录中创建了必要的文件,但 selenium 和 firefox 之间的通信失败了。浏览器窗口已打开且运行状况良好,但 Selenium 无法启动 session 。

org.openqa.selenium.WebDriverException: connection refused 

at sun.reflect.NativeConstructorAccessorImpl.newInstance0(Native Method)
at sun.reflect.NativeConstructorAccessorImpl.newInstance(NativeConstructorAccessorImpl.java:62)
at sun.reflect.DelegatingConstructorAccessorImpl.newInstance(DelegatingConstructorAccessorImpl.java:45)
at java.lang.reflect.Constructor.newInstance(Constructor.java:423)
at org.openqa.selenium.remote.W3CHandshakeResponse.lambda$new$0(W3CHandshakeResponse.java:57)
at org.openqa.selenium.remote.W3CHandshakeResponse.lambda$getResponseFunction$2(W3CHandshakeResponse.java:104)
at org.openqa.selenium.remote.ProtocolHandshake.lambda$createSession$0(ProtocolHandshake.java:122)
at java.util.stream.ReferencePipeline$3$1.accept(ReferencePipeline.java:193)
at java.util.Spliterators$ArraySpliterator.tryAdvance(Spliterators.java:958)
at java.util.stream.ReferencePipeline.forEachWithCancel(ReferencePipeline.java:126)
at java.util.stream.AbstractPipeline.copyIntoWithCancel(AbstractPipeline.java:498)
at java.util.stream.AbstractPipeline.copyInto(AbstractPipeline.java:485)
at java.util.stream.AbstractPipeline.wrapAndCopyInto(AbstractPipeline.java:471)
at java.util.stream.FindOps$FindOp.evaluateSequential(FindOps.java:152)
at java.util.stream.AbstractPipeline.evaluate(AbstractPipeline.java:234)
at java.util.stream.ReferencePipeline.findFirst(ReferencePipeline.java:464)
at org.openqa.selenium.remote.ProtocolHandshake.createSession(ProtocolHandshake.java:125)
at org.openqa.selenium.remote.ProtocolHandshake.createSession(ProtocolHandshake.java:73)
at org.openqa.selenium.remote.HttpCommandExecutor.execute(HttpCommandExecutor.java:136)
at org.openqa.selenium.remote.service.DriverCommandExecutor.execute(DriverCommandExecutor.java:83)
at org.openqa.selenium.remote.RemoteWebDriver.execute(RemoteWebDriver.java:548)
at org.openqa.selenium.remote.RemoteWebDriver.startSession(RemoteWebDriver.java:212)
at org.openqa.selenium.remote.RemoteWebDriver.<init>(RemoteWebDriver.java:130)
at org.openqa.selenium.firefox.FirefoxDriver.<init>(FirefoxDriver.java:140)

所以一般的问题是:
如何在单击按钮时强制 Firefox(由 selenium 控制)将 PDF 文件下载到我的文件系统?
任何可能性是合理的。

由于我的想法已经用尽,如果有人可以提供帮助或至少确认这些问题是 Firefox 的问题,那就太好了。

最佳答案

  1. 关闭火狐
  2. 运行 firefox 配置文件管理器(Win+R:firefox -p)
  3. 创建一个名为 selenium_profile 的新 firefox 配置文件
  4. 在 selenium_profile 中运行 firefox
  5. 手动下载所需的 PDF 文件并设置为始终下载此类文件类型

要使用 selenium_profile 运行 webdriver,请使用:

public static void setUpClass() {
FirefoxOptions options = new FirefoxOptions();
ProfilesIni allProfiles = new ProfilesIni();
FirefoxProfile selenium_profile = allProfiles.getProfile("selenium_profile");
options.setProfile(selenium_profile);
options.setBinary("C:\\Program Files (x86)\\Mozilla Firefox\\firefox.exe");
System.setProperty("webdriver.gecko.driver", "C:\\Users\\pburgr\\Desktop\\geckodriver-v0.20.0-win64\\geckodriver.exe");
driver = new FirefoxDriver(options);
driver.manage().window().maximize();}

只需编辑路径。

关于在 Firefox 中下载 PDF 的 Selenium 问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52208798/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com