gpt4 book ai didi

c# - 如何从维基百科获取表格

转载 作者:行者123 更新时间:2023-12-04 05:17:48 26 4
gpt4 key购买 nike

我想将维基百科中的一张表放入 xml 文件,然后将其解析为 C#。有可能吗?如果是,我可以只保存在 xml 中吗标题类型 专栏?

HtmlWeb web = new HtmlWeb();
HtmlDocument doc = web.Load("http://en.wikipedia.org/wiki/2012_in_film");

HtmlNode node = doc.DocumentNode.SelectSingleNode("//table[@class='wikitable']");

最佳答案

您可以使用网络浏览器:

//First navigate to your address
webBrowser1.Navigate("http://en.wikipedia.org/wiki/2012_in_film");
List<string> Genre = new List<string>();
List<string> Title = new List<string>();
//When page loaded
foreach (HtmlElement table in webBrowser1.Document.GetElementsByTagName("table"))
{
if (table.GetAttribute("className").Equals("wikitable"))
{
foreach (HtmlElement tr in table.GetElementsByTagName("tr"))
{
int columncount = 1;
foreach (HtmlElement td in tr.GetElementsByTagName("td"))
{
//Title
if (columncount == 4)
{
Title.Add(td.InnerText);
}
//Genre
if (columncount == 7)
{
Genre.Add(td.InnerText);
}
columncount++;
}

}
}
}

现在你有两个列表(流派和标题)。
您可以简单地将它们转换为 xml 文件

关于c# - 如何从维基百科获取表格,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14035674/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com