gpt4 book ai didi

phantomjs - 将phantom js处理的页面保存到带有绝对url的html文件中

转载 作者:行者123 更新时间:2023-12-04 14:30:32 25 4
gpt4 key购买 nike

我想在通过所有 url 将文档加载到特殊文件名后保存我的特殊网页,并将链接转换为绝对 url,例如 wget -k .

//phantomjs
var page = require('webpage').create();
var url = 'http://google.com/';
page.open(url, function (status) {
var js = page.evaluate(function () {
return document;
});
console.log(js.all[0].outerHTML);
phantom.exit();
});

例如我的 html 内容是这样的:
<a href="//page.html">page</a>

必须是
<a href="http://google.com/page.html">page</a>

这是我的示例脚本,但我如何转换所有 url 和链接,例如 wget -k使用phantomjs?

最佳答案

您可以修改最终的 HTML,使其具有 <base>标签 - 这将使所有相对 URL 工作。在您的情况下,尝试输入 <base href="http://google.com/">紧跟在 <head> 之后在页面上。

关于phantomjs - 将phantom js处理的页面保存到带有绝对url的html文件中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14553925/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com