gpt4 book ai didi

c# - HtmlAgilityPack - 如何在大型网页中抓取
数据

转载 作者:太空宇宙 更新时间:2023-11-03 22:11:15 24 4
gpt4 key购买 nike

我正在尝试从网页中获取数据,<DIV>特定类(class)<DIV class="personal_info">它有 10 个相似的 <DIV> S 并且属于同一类“Personal_info”(如 HTML 代码所示,现在我想提取每个网页中 10 - 15 类 personal_info 的所有 DIV。

<div class="personal_info"><span class="bold">Rama Anand</span><br><br> Mobile: 9916184586<br>rama_asset@hotmail.com<br> Bangalore</div>

为了完成必要的工作,我开始使用 HTML AGILE PACK,正如 Stack overflow 中的某个人所建议的那样我一开始就卡住了,因为我对 HtmlAgilePack 缺乏了解,我的 C# 代码是这样的

HtmlAgilityPack.HtmlDocument docHtml = new HtmlAgilityPack.HtmlDocument();
HtmlAgilityPack.HtmlWeb docHFile = new HtmlWeb();

docHtml = docHFile.Load("http://127.0.0.1/2.html");

然后如何进一步编码以便从类为“personal_info”的 DIV 中获取数据......将不胜感激并提供示例建议

最佳答案

我现在不能检查这个,不是吗:

var infos = from info in docHtml.DocumentNode.SelectNodes("//div[@class='personal_info']") select info; 

关于c# - HtmlAgilityPack - 如何在大型网页中抓取 <DIV> 数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6543086/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com