gpt4 book ai didi

java - 在解析之前执行网页中的所有javascript

转载 作者:行者123 更新时间:2023-11-29 05:12:48 24 4
gpt4 key购买 nike

我想下载包含一些 javascript 的网页的 html。如果我使用像 jsoup 这样的库,我将获得没有 javascript 生成的元素的 html。

如何获取javascript执行后得到的html?

编辑:如何在 Java 程序中使用答案中的脚本?

最佳答案

您可以使用 PhantomJS使用以下脚本:

var page = require('webpage').create();
page.open('http://stackoverflow.com',function(status){
if(status !== 'success'){
console.log('Open failed');
}else{
console.log(page.evaluate(function(){
return document.documentElement.outerHTML;
}));
}
phantom.exit();
});

如果您想从 Java 执行此脚本,请阅读以下内容:

Running Phantomjs from javascript, JSP or Java

关于java - 在解析之前执行网页中的所有javascript,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27756540/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com