gpt4 book ai didi

javascript - 如何获取页面加载的所有请求的响应正文?

转载 作者:行者123 更新时间:2023-12-03 00:44:49 26 4
gpt4 key购买 nike

我目前正在开发一个需要从网页获取数据的工具。 (类似于抓取但不完全一样)。我需要的是一种获取页面加载的所有请求的响应正文的方法。我找到了一个解决方案(confess.js),它使用 phantomjs 来获取主(发起者)请求的正文。列出主请求和子请求的 URL、 header 和 cookie,甚至主体大小。但我似乎找不到一种方法来获取子请求的正文数据(JS、CSS、图像等资源以及任何 xhr 请求)。实现这一目标的最佳方法是什么? (我不想单独点击每个网址,从而使我的网页上的点击次数加倍)任何帮助将不胜感激。谢谢。

最佳答案

有一个简单的答案: https://mitmproxy.org/

在本地安装它并配置您的浏览器以使用此代理。比您可以跟踪所有流量。(并且将轻松支持 https)

如果您需要以编程方式访问这些数据,您最好看看一些 Nodejs 代理库。( http://anyproxy.io , https://github.com/nodejitsu/node-http-proxy )

您需要一个“反向代理”来传递所有请求。然后您可以控制页面中所有传出请求的请求/响应。你可以“捕获”网址、正文等..

关于javascript - 如何获取页面加载的所有请求的响应正文?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53293890/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com