gpt4 book ai didi

c# - 传递 HTML 页面字符串并使用 HtmlAgilityPack 进行抓取

转载 作者:太空宇宙 更新时间:2023-11-03 17:55:48 25 4
gpt4 key购买 nike

为什么会出现此错误?

"Illegal characters in path" at htmlDoc.Load(pageSource)

pageSource 是 HTML 页面的字符串变量。我需要将页面源作为字符串传递,而不是作为文件而不是 URL。我该怎么做?

Dim ids As New List(Of String)()
Dim pageSource = getHtml(url)

Dim htmlDoc As HtmlDocument = New HtmlDocument()

htmlDoc.OptionFixNestedTags = True


htmlDoc.Load(pageSource)


Dim s As HtmlNodeCollection = htmlDoc.DocumentNode.SelectNodes("//div/@id")

For Each div As HtmlNode In s
ids.Add(div.Id)
Next

最佳答案

使用LoadHtml代替Load:

htmlDoc.LoadHtml(pageSource)

See also the source.

关于c# - 传递 HTML 页面字符串并使用 HtmlAgilityPack 进行抓取,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11589469/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com