gpt4 book ai didi

automation - headless 互联网浏览器?

转载 作者:行者123 更新时间:2023-12-02 22:59:21 25 4
gpt4 key购买 nike

我想做以下事情。登录网站,单击几个特定链接,然后单击下载链接。我想将其作为 Windows 上的计划任务或 Linux 上的 cron 作业运行。我对使用的语言并不挑剔,但如果可能的话,我希望它能够在不将浏览器窗口放在屏幕上的情况下运行。

最佳答案

以下是我所了解的 headless 浏览器列表:

  • HtmlUnit - java 。自定义浏览器引擎。有限的 JavaScript 支持/DOM 模拟。开源。
  • Ghost - 仅限Python。基于WebKit。完整的 JavaScript 支持。开源。
  • Twill - Python/命令行。自定义浏览器引擎。没有 JavaScript。开源。
  • PhantomJS - 命令行/所有平台。基于WebKit。完整的 JavaScript 支持。开源。
  • Awesomium - C++/.NET/所有平台。基于 Chrome 。完整的 JavaScript 支持。商业/免费。
  • SimpleBrowser - .NET 4/C#。自定义浏览器引擎。没有 JavaScript 支持。开源。
  • ZombieJS - 节点.js。自定义浏览器引擎。 JavaScript 支持/模拟 DOM。开源。基于jsdom .
  • EnvJS - 通过 Java/Rhino 的 JavaScript。自定义浏览器引擎。 JavaScript 支持/模拟 DOM。开源。
  • Watir-webdriverheadless gem - 通过 WebDriver 进行 Ruby。通过浏览器 (Firefox/Chrome/Safari/IE) 提供完整的 JS 支持。
  • Spynner - 仅限Python。 PyQT 和 WebKit。
  • jsdom - 节点.js。自定义浏览器引擎。通过模拟 DOM 支持 JS。开源。
  • TrifleJS - 使用 MSIE (Trident) 和 V8 移植 PhantomJS。开源。
  • ui4j - 纯Java 8解决方案。围绕 JavaFx WebKit 引擎的包装器库,包括。 headless 模式。
  • Chromium Embedded Framework - Chromium 的完整最新嵌入式版本,可根据需要进行离屏渲染。 C/C++,带有 .NET 包装器(和其他语言)。由于它是 Chromium,所以它支持一切。 BSD 许可。
  • Selenium WebDriver - 通过浏览器(Firefox、IE、Chrome、Safari、Opera)完全支持 JavaScript。官方支持bindings包括 C#、Java、JavaScript、Haskell、Perl、Ruby、PHP、Python、Objective-C 和 R。非官方绑定(bind)可用于 QtGo 。开源。

通过模拟 DOM 提供 JavaScript 支持的 headless 浏览器通常会对某些使用更高级/晦涩的浏览器功能或具有视觉依赖性功能(例如通过 CSS 位置等)的网站产生问题,因此,虽然纯 JavaScript这些浏览器的支持通常是完整的,实际支持的浏览器功能应被视为仅部分。

(注意:这篇文章的原始版本只提到了 HtmlUnit,因此有评论。如果您知道其他 headless 浏览器实现并具有编辑权限,请随时编辑这篇文章并添加它们。)

关于automation - headless 互联网浏览器?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/814757/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com