gpt4 book ai didi

javascript - 从 Node.js 请求包发出大量请求时出现 "Error: ENOTFOUND"

转载 作者:太空宇宙 更新时间:2023-11-04 02:32:58 25 4
gpt4 key购买 nike

我正在 Node.js 中运行一个使用 request 的脚本。包来帮助我发出 HTTP 请求。该脚本会发出 100 到 1000 个请求,以便下载 PDF 并将其放入本地计算机上的某个文件夹中。当我只发出 100 个请求时,程序工作正常,所有 PDF 都显示在我的文件夹中,但是当我发出更多请求时,程序开始抛出此错误 (ENOTFOUND),并且抛出此错误的文件在文件夹中为空白。当我手动加载引发错误的链接时,它们工作正常(所以我知道这不是主机的问题),我可以下载这样的文件,但我想自动化它。

这是函数中给出错误的部分。我已开始尝试将所有出错的链接推送到数组,但尚未解决该问题。

  var year = process.argv[3] % 2000;
var url = yearURL[year];

request(url, function(error, response, html){
if(!error){
var $ = cheerio.load(html, {xmlMode: true});

$('link', 'item').each(function(){
var link = $(this).text();
PDFscrape(link);
});
}
});

function PDFscrape(link){
request(link, function(error, response, html){
if(!error){
var $ = cheerio.load(html);

var num = $('#ctl00_ContentPlaceHolder1_lblFile2', '#ctl00_ContentPlaceHolder1_pageDetails').text();
console.log('Document ' + num + ' has been loaded.');
var i = 1;
$('a', '#ctl00_ContentPlaceHolder1_lblAttachments2').each(function(){
var pdf = 'https://phila.legistar.com/' + $(this).attr('href');
AddPDF(pdf, num, i);
i++;
});
}
})
}

function AddPDF(link, file, i){
var name = file;
var fileName;
if (year !== 100 && year !== -2){
fileName = fs.createWriteStream(__dirname + '/pdfs/20' + year + '/' + file + '_' + i + '.pdf');
} else if (year === 100){
fileName = fs.createWriteStream(__dirname + '/pdfs/recent100/' + file + '_' + i + '.pdf');
} else if (year === -2){
fileName = fs.createWriteStream(__dirname + '/pdfs/recent10/' + file + '_' + i + '.pdf');
}

request({
uri: link,
headers: {
'Host': 'phila.legistar.com',
'User-Agent': 'request'
}
}, function(err) {
if (err){
var errLink = {url: link, file: name, num: i}
var count = errors.push(errLink);
console.log('--------- Error: ' + count + ' ---------');
}
}).pipe(fileName);
}

抛出的错误是:

  stream.js:94
throw er; // Unhandled stream error in pipe.
^
Error: getaddrinfo ENOTFOUND
at errnoException (dns.js:37:11)
at Object.onanswer [as oncomplete] (dns.js:124:16)

注意:我正在处理该错误,但是给出此错误的文档在不应该的情况下被作为空白通过管道传输。我只是不明白为什么文件会给出错误。

最佳答案

缺少一些分号,使用 != 而不是 !== 的方式有些不雅,file 的双重含义使用不好,但没有什么可以解释您所看到的内容。我猜 year 有点糟糕。在这里发布我的代码版本并附上一些评论。

(我在这里发帖,而不是在评论中,因为无法在评论中发布长代码):

function AddPDF(link, filename, i) {
var file;
if (year !== 100 && year !== -2) {
// probably want "!==" rather than "=="
file = fs.createWriteStream(__dirname + '/' + file + '_' + i + '.pdf');
} else {
// WHAT HAPPENS HERE?
// what is "file", that is later piped to?
// this may be your issue.
// Where is this "year" coming from? Can you show relevant code?
}

request({
uri: link,
headers: {
'Host': 'phila.legistar.com',
'User-Agent': 'request'
}
}, function(err) {
var errLink, count;
if (err) {
errLink = {url: link, file: filename, num: i};
count = errors.push(errLink);
console.log('--------- Error: ' + count + ' ---------');
}
}).pipe(file);
}

最后,您仍然没有提供实际的跟踪。

关于javascript - 从 Node.js 请求包发出大量请求时出现 "Error: ENOTFOUND",我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24874221/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com