gpt4 book ai didi

javascript - 使用 Phantomjs/Pjscrape 抓取多个页面

转载 作者:行者123 更新时间:2023-11-29 22:18:49 24 4
gpt4 key购买 nike

尝试抓取多个页面但无法让 urlid 数组在 pjscrape .js 文件中工作。

我很确定我可能会犯一个新手错误,但我希望能得到一些帮助。谢谢:)

pjs.config({

timeoutInterval: 6000,
timeoutLimit: 10000,

})

pjs.addSuite({
// single URL or array
url: abolaURLs,
scraper: function(){
var abolaURLs = [366762,366764,366763];
for (var i = 0; i<abolaURLs.length; i++) {
abolaURLs[i] = 'http://abola.pt/nnh/ver.aspx?id=' + abolaURLs[i];
};
var results[];
var cenas1 = $('div#a5g2').text();
var cenas2 = $('span#noticiatext').text();
var cenas3 = $('div#a5x').text();
results.push(cenas1, cenas2, cenas3);
return results;
}
});

最佳答案

这对你有用:

var abolaURLs = [366762,366764,366763];

for (var i = 0; i < abolaURLs.length; i++) {
abolaURLs[i] = 'http://abola.pt/nnh/ver.aspx?id=' + abolaURLs[i];
};

pjs.addSuite({
url: abolaURLs,
scraper: function() {
var results = []; // !! you have the wrong array declaration result[]
var cenas1 = $('div#a5g2').text();
var cenas2 = $('span#noticiatext').text();
var cenas3 = $('div#a5x').text();
results.push(cenas1, cenas2, cenas3);
return results;
}
});

pjs.config({
timeoutInterval: 6000,
timeoutLimit: 10000,
});

关于javascript - 使用 Phantomjs/Pjscrape 抓取多个页面,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13582461/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com