gpt4 book ai didi

php - 使用 Phantom 的网页 HTML

转载 作者:搜寻专家 更新时间:2023-11-01 00:33:59 25 4
gpt4 key购买 nike

我正在尝试使用 PhantomJS 加载页面(使用 Javascript 加载网页上的项目)并将页面上的所有 HTML(至少在 <body /> 标记内)返回到执行 phantomjs httpget.js 的 PHP 函数。

问题: 我可以让 phantomjs 返回 document.title ,但要求它返回 console.log(document.body) 简单地给我一个 [object Object] 。如何提取页面的 HTML?

与浏览器相比,使用 phantomjs 加载网页也需要更长的时间

httpget.js

console.log('hello!');
var page = require('webpage').create();
page.open("http://www.asos.com/Men/T-Shirts-Vests/Cat/pgecategory.aspx?cid=7616#parentID=-1&pge=0&pgeSize=900&sort=1",
function(status){
console.log('Page title is ' + page.evaluate(function () {
return document.body;
}));
phantom.exit();
});

输出 (从 shell 运行)

hello!
Page title is [object Object]

最佳答案

document.body.innerHTML 包含正文的 HTML。

关于php - 使用 Phantom 的网页 HTML,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12031096/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com