gpt4 book ai didi

c# - 使用 C# 从 html 标签中提取文本

转载 作者:行者123 更新时间:2023-11-28 05:15:51 26 4
gpt4 key购买 nike

我在变量中有以下标签。我需要使用 C# 将 typeid 的值提取到不同的变量。最好的方法是什么?

<a href="gana:$type=FlexiPage;id=c828c4ea-075d-4dde-84f0-1876f8b71fa8;title=Workflow%20flexi$">workflow link</a>

最佳答案

如果我必须解析 HTML,我也会使用 HtmlAgilityPack。您可以使用 SelectSingleNodeGetAttributeValue 和字符串方法来创建键值对字典:

var doc = new HtmlAgilityPack.HtmlDocument();
doc.LoadHtml(html));
var anchor = doc.DocumentNode.SelectSingleNode("a");
string href = anchor.GetAttributeValue("href", "");

// take the text between both $
int startIndex = href.IndexOf('$') + 1;
href = href.Substring(startIndex, href.Length - startIndex);

Dictionary<string, string> pageInfos = href.Split(';')
.Select(token => token.Split('='))
.ToDictionary(kv => kv[0].Trim(), kv => kv[1].Trim(), StringComparer.InvariantCultureIgnoreCase);
string id = pageInfos["id"]; // c828c4ea-075d-4dde-84f0-1876f8b71fa8
string type = pageInfos["type"]; // FlexiPage

关于c# - 使用 C# 从 html 标签中提取文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46115149/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com