javascript - 通过 javascript 使用外部 js/css/images 检索整个 html

转载作者：行者123 更新时间：2023-11-28 02:06:11

24

4

我已经有一个 Javascript 文件(执行某些功能)，它将被附加到网页上。现在我希望 Javascript 收集整个网页及其 html 标签、图像、外部 Javascript 文件和外部 css 文件。 我不想在这里使用 Jquery/任何其他外部库。

我的动机是获取整个网页，将其保存并显示为与原始网页相似。

这可以用 Javascript 实现吗？

任何帮助将不胜感激。

最佳答案

简短回答 - 否

不，使用 JavaScript 是不可能的，尤其是“保存”部分，因为 JavaScript 在浏览器环境中没有文件访问权限(我们在此假设)，除非在开发浏览器扩展程序或明确修改浏览器的安全属性时允许这样做。

长答案 - 如果你真的必须:漫长而曲折的道路......

加载正确的内容

首先你需要弄清楚whether you want to fetch the page in its static status (as it is sent by the server on the first page load), or in its currently rendered status (after it's been rendered in the browser, and that scripts have executed and may have added content to the page) .

加载资源

然后您需要遍历 DOM 的所有元素，并获取所有外部资源(包括 CSS 文件中引用的资源)。

您可能希望在您的请求中使用 HTML 或纯文本 mime 类型获取所有资源，否则您的浏览器可能会触发带有最终用户弹出窗口的可见下载，并且根本不会执行您的透明下载。

更新所有引用

接下来，您需要弄清楚您希望如何组织“下载的”内容、将资源放在哪里以及如何命名它们以避免冲突。

完成后，您需要再次遍历所有 DOM 元素并更新引用以使用本地资源的路径而不是本地资源。

将内容写入磁盘

现在最后一点是将所有这些资源保存到磁盘，使用浏览器的自定义 API 或 HTML5 File System APIs .

这里有龙

这些都不能保证您会达到您想要的效果，因为某些页面可能仍然包含代码，这些代码一旦像这样下载后将无法正常运行。可能有代码从远程 URL 请求内容或假定某些目录结构和端点，或使用您可能已修改的资源名称等...(这很奇怪，但并不罕见)。

关于javascript - 通过 javascript 使用外部 js/css/images 检索整个 html，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/11415518/

24

4

0

文章推荐： html - Ajax 表单提交，无法弄清楚为什么它不起作用

文章推荐： c++ - 多个函数调用对相同的输入参数返回不同的结果

文章推荐： html - 调整窗口大小时如何使图像和文本在 HTML 中对齐？

文章推荐： javascript - 必须在 jQuery 上单击两次

带有通配符的 webpack 外部
如何指示 webpack 排除所有 d3 模块？ // does not work externals: { "d3-*": "d3" } 所以如果应用导入了d3-submod
Scala 外部 => 语法
这个问题在这里已经有了答案: 9年前关闭。 Possible Duplicate: What does “outer =>” really mean? 我在哪里可以找到有关信息 trait After
javascript - 外部 for 循环时的非线性性能
这是一个简单的循环，我正在尝试对性能进行基准测试。 var extremeLoop=function(n){ var time=new Date() var t=0; for(
jquery - 外部+内联样式与仅外部样式
问题+概述下面是两个片段，其中包含最初隐藏的 div，然后通过单击 button 和 jQuery 的 .show() 显示。两个 div 都具有由外部样式表应用的 display: grid; 样
javascript - 外部.js文件获取不到页面元素？
我有一个 HTML 页面和一个单独的 .js 文件，该文件包含在带有的页面中标签。这是我的 .js 文件: element = document.getElementById("test");
类的第二个实现文件中静态字段的 C++ 外部？
我在 linux 静态库项目中有 3 个文件，我想在两个类方法实现文件中使用的静态字段存在链接问题。我有 class1.h、class1main.cpp 和 class1utils.cpp。 clas
javascript - 外部单击以重置颜色？
我正在尝试将颜色背景更改为默认背景颜色，当我点击输入框外我尝试使用“null”或“none”但没有用？ window.addEventListener('click', outsideClick);
Android 文件选择器将音频文件重定向到/外部
我正在编写一个应用程序，要求用户在手机上选择各种类型的文件。我使用此代码启动文件选择器 Intent : Intent intent = new Intent(Intent.ACTION_GET_C
android - 外部-内部存储
在 android 中，不可移动(内部)的外部存储和内部存储有什么区别？我不确定在哪里保存我的数据。我只需要保存一个人可以随时提取的游戏统计数据谢谢最佳答案在许多较新的设备中，将不再有物理区别，
c++ - 外部、链接和全局变量
在 C++ 中，假设我们有这个头文件: myglobals.h #ifndef my_globals_h #define my_globals_h int monthsInYear = 12; #en
C++ 外部/多重定义
我正在尝试使用 externs 在 C++ 中连接到 Ada。这两种实现有什么区别？实现A namespace Ada { extern "C" { int getN
jQuery: 外部 html()
这个问题在这里已经有了答案: Get selected element's outer HTML (30 个答案) 关闭 2 年前。想象一下我们有这样的东西: Hello World 如果我们这样
vb6 - 外部 DLL 应该放在哪里？
假设我在模块的顶部有这个: Public Declare Function getCustomerDetails Lib "CustomerFunctions" () As Long 如果我从 VB6
javascript - 外部 Javascript 文件获取？
我目前正在使用这段代码: var wordRandomizer = { run: function (targetElem) { var markup = this.creat
svn - 如何部署 Subversion 外部？
我们正在使用 SVN 试水，并以 Beanstalk 作为主机。我们的设置如下所示: 存储库:模块模块一模块二模块 3 存储库:网站1 自定义网站代码 svn:对模块 1 的外部引用 svn:对
Kubernetes 外部 ip 负载均衡器裸机
有没有办法在负载均衡器中设置自动外部 IP 分配给像谷歌这样的服务？我在裸机上运行 Kubernetes。谢谢最佳答案使用 nodePort 类型的服务，它会将您的服务绑定(bind)到所有节
symfony - generateUrl 外部 Controller
是否有可能在 Controller 之外使用 generateUrl() 方法？我尝试在带有 $this->get('router') 的自定义存储库类中使用它，但它没有用。更新我在这里找到了一
Angular 作为 Webpack 外部
我目前正在尝试通过 Webpack 外部对象外部化 Angular 依赖项来缩短构建时间。到目前为止，我已经为 React 和其他小库实现了这一目标。如果我只是移动 '@angular/compil
gradle - 创建一个依赖于另一个(外部)插件的Gradle插件
我想创建一个自动应用其他插件的插件(外部插件)。这要求在我称为“应用插件”之前为插件设置构建脚本依赖项。但是似乎我无法在插件中添加buildscript依赖项，或者得到了: 您不能更改处于未解析状态的
r - 创建自定义几何图形来计算汇总统计数据并在绘图区域*外部*显示它们
我是R包的创建者EnvStats . 有一个我经常使用的函数，叫做 stripChart .我刚开始学习ggplot2 ，并在过去几天里仔细研究了 Hadley 的书、Winston 的书、Stack

首页

博学

6Ren·AI

商城