]*)\", RegexOptions.Ig-6ren">
gpt4 book ai didi

c# - 在文档中查找 HTML 字符串

转载 作者:搜寻专家 更新时间:2023-10-31 21:53:37 26 4
gpt4 key购买 nike

我想获取所有 HTML <p>...</p>在文档中。
使用 Regex使用以下命令查找所有此类字符串:

Regex regex = new Regex(@"\<p\>([^\>]*)\</p\>", RegexOptions.IgnoreCase);

但是我无法得到任何结果。我的正则表达式有什么问题吗?

现在,我只想获取 <p>...</p> 之间的所有内容标记并希望为此使用正则表达式,因为源不是 HTML 文档。

最佳答案

DO NOT PARSE HTML USING Regular Expressions !!!


相反,使用 HTML Agility Pack .

例如:

var doc = new HtmlDocument();
doc.Load(...);

var pTags = doc.DocumentNode.Descendants("p");

编辑:即使文档实际上不是 HTML,您也可以这样做。

关于c# - 在文档中查找 HTML 字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2103094/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com