gpt4 book ai didi

c# - 如何使用 HTML 敏捷包抓取内容

转载 作者:行者123 更新时间:2023-11-28 01:50:00 27 4
gpt4 key购买 nike

我完全是 HTML 敏捷包的新手,如何在 C# 中使用 HTML 敏捷包获取这些内容(代理)。

我的代码:

string url = "http://www.proxybase.de/";
HtmlWeb web = new HtmlWeb();
HtmlAgilityPack.HtmlDocument doc = web.Load(url);
var nodes = doc.DocumentNode.SelectNodes("//table[@border='0' and @cellspacing='0' and @cellpadding='0']");

if (nodes != null)
{
foreach (HtmlNode item in nodes)
{
if (item != null)
{
string s = item.InnerText;
listView1.Items.Add(s);
}
}
}
else
{
MessageBox.Show("Nothing found");
}

HTML 看起来像......

<table border="0" cellpadding="0" cellspacing="0">
<tbody>
<tr>...</tr> //Ignore first one
<tr>
<td>...</td>
<td style="padding-left:5px;border-left;1px solid #999;"> 123.45.678.90:80 </td>
<td style="padding-left:5px;border-left;1px solid #999;">...</td>
</tr>
</tbody>
</table>

已更新:

How can I use SelectSingleNode to select table data with index array ?

最佳答案

我认为您需要将网站信息(例如 ip 地址等)存储到文件或数据库中

如果以上为真,你就快到了:这应该可以解决:

    string url = "http://www.proxybase.de/";
HtmlWeb web = new HtmlWeb();
HtmlAgilityPack.HtmlDocument doc = web.Load(url);
foreach (HtmlNode node in doc.DocumentNode.SelectNodes("//td[@style='padding-left:5px;border-left;1px solid #999;'"))
{
String s = HtmlNode.InnerText;
//Now the IP address is stored in s.
//You can either put it in a file/database or a webpage :)
}

关于c# - 如何使用 HTML 敏捷包抓取内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20651196/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com