gpt4 book ai didi

javascript - 如何使用 Node.js 抓取页面

转载 作者:太空宇宙 更新时间:2023-11-04 00:37:05 33 4
gpt4 key购买 nike

我正在尝试抓取网站,但无法将结果写入 HTML 文件。

我在node.js中使用了cheerio,我的代码如下。

var http = require('http');
var path = require('path');
var request = require('request');
var cheerio = require('cheerio');

http.createServer(function (req, res) {
res.write('<html><head></head><body>');
request('http://www.espn.com', function(err, res, html){
var $ = cheerio.load(html);

$('a.realStory').each(function(i, element) {
var node = $(this);
var text = node.text();
res.write('<p>'+ text +'</p>');
});
});

res.end('</body></html>');
}).listen(1337);

我如何运行这个文件,然后转到我的本地主机来查看它?

最佳答案

基本实现:

var express = require('express'),
path = require('path'),
request = require('request'),
cheerio = require('cheerio'),
app = express();
app.get('/', function (req, res) {
request('http://www.espn.com', function (e, r, html) {
var $ = cheerio.load(html);
$('a.realStory').each(function (i, element) {
var node = $(this);
var text = node.text();
res.write('<p>' + text + '</p>');
});
res.end();
});
});
app.listen(process.env.PORT || 1337, function () {
console.log("Server running..");
});

关于javascript - 如何使用 Node.js 抓取页面,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38548932/

33 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com