gpt4 book ai didi

javascript - 如何使用 puppeteer 查找网页上的所有资源?

转载 作者:太空宇宙 更新时间:2023-11-04 03:21:24 24 4
gpt4 key购买 nike

我想使用 puppeteer 来搜索页面并返回所有可用资源,包括图像、pdf、任何可嵌入的内容等。

出于我们的目的,让我们简单地使用图像进行滚动。 img 标签具有 src 属性,但是通过 CSS 规则加载的图像又如何呢?有没有办法查看加载的资源总数?

最佳答案

一种方法是listen on the event 请求完成

const browser = await puppeteer.launch();
const page = await browser.newPage();

page.on('requestfinished', (request) => {
console.log(request.url())
});

await page.goto('http://www.wildesoft.net/');
await page.waitFor(5000);

await browser.close();

这会将收到的所有资源记录到控制台,例如

Screen grab of result

关于javascript - 如何使用 puppeteer 查找网页上的所有资源?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49702770/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com