gpt4 book ai didi

web-scraping - 如何使用 Puppeteer Sharp 从 h1 标签中获取文本?

转载 作者:行者123 更新时间:2023-12-04 09:09:26 25 4
gpt4 key购买 nike

我的问题是:
我正在尝试连接到 http://example.com con Puppeteer Sharp,我想在控制台中显示该页面中 de h1 标签的文本。文本是“示例域”。
我有这个代码:

  await new BrowserFetcher().DownloadAsync(BrowserFetcher.DefaultRevision);
var browser = await Puppeteer.LaunchAsync(new LaunchOptions
{
Headless = true
});

using (var page = await browser.NewPageAsync())
{
await page.GoToAsync("http://example.com");
await page.WaitForSelectorAsync("h1");
var texto = await page.QuerySelectorAsync("h1");
Console.WriteLine(texto.ToString());
}
await browser.CloseAsync();
但控制台显示“JSHandle@node”。如何从 JSHandle@node 中获取 h1 的值?
非常感谢。

最佳答案

您快到了!
您需要一个 EvaluateFunctionAsync<>() 之后返回H1 的innerText QuerySelectorAsync()

var texto = await page.QuerySelectorAsync("h1").EvaluateFunctionAsync<string>("_ => _.innerText");

关于web-scraping - 如何使用 Puppeteer Sharp 从 h1 标签中获取文本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63384204/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com