gpt4 book ai didi

node.js - 在 node.js 中进行屏幕抓取的最优雅的方法是什么?

转载 作者:IT老高 更新时间:2023-10-28 23:03:22 26 4
gpt4 key购买 nike

我正在开发一个网络应用程序,该应用程序在 node.js 中使用广泛的屏幕抓取。我觉得我在每个角落都在与潮流作斗争。必须有一种更简单的方法来做到这一点。最值得注意的是,有两件事很烦人:

  1. Cookie 传播。我可以将 'set-cookie' 数组从响应 header 中提取出来,但是执行字符串操作来解析数组中的 cookie 感觉非常糟糕。

  2. 重定向关注。当返回 302 状态代码时,我希望每个请求都遵循重定向。

我遇到了两件事,看起来有用,但我最终无法使用:

是否有任何 JavaScript 屏幕抓取类库可以传播 cookie、遵循重定向并支持 HTTPS?有关如何使这更容易的任何指示?

最佳答案

我现在实际上有一个爬虫库 https://github.com/mikeal/spider挺好的,可以用jquery和routes。

欢迎反馈:)

关于node.js - 在 node.js 中进行屏幕抓取的最优雅的方法是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5441265/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com