gpt4 book ai didi

c# - .NET 正则表达式 td、span、标签之间的内部文本

转载 作者:行者123 更新时间:2023-12-03 04:41:34 24 4
gpt4 key购买 nike

<table >
<tr>
<td colspan="2" style="height: 14px">
tdtext1
<a>hyperlinktext1<a/>
</td>
</tr>
<tr>
<td>
tdtext2
</td>
<td>
<span>spantext1</span>
</td>
</tr>
</table>

这是我的示例文本。 如何在 C# 中编写正则表达式来获取 tdspan、超链接的内部文本的匹配

最佳答案

每次在同一个句子中听到“正则表达式”和“HTML”这两个词时,我都会感到畏缩。我建议查看 HtmlAgilityPack CodePlex 是一个非常宽容的 HTML 解析器,允许您对解析的文档使用 XPath 查询。它更加简洁,继承您代码的人会感谢您!

编辑

根据下面的评论,这里有一些如何获取这些标签的 InnerText 的示例。非常简单。

var doc = new HtmlDocument();
doc.LoadHtml("...your sample html...");

// all <td> tags in the document
foreach (HtmlNode td in doc.DocumentNode.SelectNodes("//td")) {
Console.WriteLine(td.InnerText);
}

// all <span> tags in the document
foreach (HtmlNode span in doc.DocumentNode.SelectNodes("//span")) {
Console.WriteLine(span.InnerText);
}

// all <a> tags in the document
foreach (HtmlNode a in doc.DocumentNode.SelectNodes("//a")) {
Console.WriteLine(a.InnerText);
}

关于c# - .NET 正则表达式 td、span、标签之间的内部文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2871480/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com