gpt4 book ai didi

node.js - Cheerio如何忽略某个标签的元素

转载 作者:太空宇宙 更新时间:2023-11-03 22:50:53 25 4
gpt4 key购买 nike

我正在抓取网页的正文:

axios.get(url)
.then(function(response){
var $ = cheerio.load(response.data);
var body = $('body').text();
});

问题是,我想从 <footer> 中排除内容标签。我该怎么做?

最佳答案

cheerio 在解析 HTML 时创建一个伪 DOM。您可以像在浏览器中操作 DOM 一样操作该 DOM。在您的具体情况下,您可以使用任意数量的方法从 DOM 中删除项目,例如

 .remove()
.replaceWith()
.empty()
.html()

因此,基本思想是您将使用选择器来查找页脚元素,然后将其删除,如下所示:

$('footer').remove();

然后,在删除这些元素后获取文本:

var body = $('body').text();

关于node.js - Cheerio如何忽略某个标签的元素,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44690023/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com