gpt4 book ai didi

c# - 从 Div 标签中提取内容 C# RegEx

转载 作者:太空宇宙 更新时间:2023-11-04 14:47:53 27 4
gpt4 key购买 nike

我需要将此内容提取到 divtestimonial1 div 中我正在使用以下正则表达式,但它只返回第一行

Regex r = new Regex("&lt;div([^<]*<(?!/div>))");
  <div class="testimonial_content" id="divtestimonial1">          <a name="T1"></a>          <div class="testimonial_headline">%testimonial1headline</div>          <p align="left"><img src="" alt="" width="193" height="204" align="left" hspace="10" id="img_T1"/><span class="testimonial_text">%testimonial1text</span><br />          </p>  </div>

最佳答案

Regular expressions are generally not a good choice for parsing HTML .您最好使用诸如 HTML Agility Pack 之类的工具,所以我建议您使用它。

也就是说,您可以使用此正则表达式匹配您的特定示例输入:

<div.*?id="divtestimonial1".*?>.*</div>

但它可能会破坏您的真实场景。 Regex 和 HTML 的问题之一是正确检测标签的嵌套等。

关于c# - 从 Div 标签中提取内容 C# RegEx,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4775265/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com