gpt4 book ai didi

python - Selenium-Phantomjs 下载 csv

转载 作者:太空狗 更新时间:2023-10-30 00:19:37 25 4
gpt4 key购买 nike

我正在尝试使用 PhantomJS 从对话框中下载(保存到磁盘)CSV 文件。使用 firefox 配置文件,通过设置浏览器配置文件属性,这将非常简单。有什么建议可以在 phantomjs 中下载 excel 文件吗?

这是使用 firefox 驱动程序完成的方式:

profile = webdriver.firefox.firefox_profile.FirefoxProfile()
profile.set_preference("browser.download.folderList",2)
profile.set_preference("browser.download.dir",self.opts['output_dir'])
profile.set_preference('browser.helperApps.neverAsk.saveToDisk', ('application/octet-stream,application/msexcel'))

我正在使用 Phantomjs 驱动程序:

webdriver.PhantomJS(service_args=['--ignore-ssl-errors=true','--local-storage-path=/tmp'])

并寻找一种方法来设置属性,这些属性可以覆盖保存到磁盘并设置数据的 MIME 类型。目前没有设置属性,PhantomJS 驱动程序不会下载文件。

我已经阅读了有关避免对话框等的链接,但在这种情况下,它是必需的。

最佳答案

我最近遇到了类似的问题。然而,我最终切换了网络驱动程序,因为它提供了相对容易地访问网络流量的能力。这意味着如果文件不直接在页面上而是被传输进来,您将无法在幻影中看到它。有几个人在解决问题,但我发现我的大部分文件都在传输,因此我更容易使用 web 驱动程序 + firebug + net export 收集网络流量。

然而,在 phantomjs 中,非常 hacky 的方式是这样的:

phantomjs.exe file_to_run.js > my_log.txt

您只需将控制台内容保存到文件中。但是,您可能会在文件中收到错误和其他消息。你可以清理它,因为你只是在寻找 cdv。

根据我的理解,PhantomJS 是有限的,因为开发人员对它应该如何设计有一个非常具体的想法。例如,他们停止支持闪存。没有像在 Firefox 中那样简单的本地下载和保存文件的方法。您可以启动另一个网络浏览器并通过它下载。然而,我认为最简单的方法是使用 CasperJS,它与 PhantomJS 配合得很好。

可以在这里找到使用 casperJS 下载文件的一个很好的例子:casperjs download csv file

我认为使用 casper 的主要问题是大文件没有得到很好的支持。您是否有特定原因更喜欢使用 headless 浏览器?

关于python - Selenium-Phantomjs 下载 csv,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21864226/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com