gpt4 book ai didi

c# 正则表达式在一些 html 标签中

转载 作者:行者123 更新时间:2023-11-30 17:30:27 27 4
gpt4 key购买 nike

我在几个小时内尝试使用正则表达式在一些 html 标记中获取文本:

<div class="ewok-rater-header-section">
<ul class="header">

<li><h1>meow</h1></li>

<li><h1>meow2</h1></li>

<li><h1>Time = <span class="work-weight">9.0 minutes</span></h1></li>

</ul>
</div>

我带着

var regexpost = new System.Text.RegularExpressions.Regex(@"<h1(.*?)>(.*?)</h1>");
var mpost = regexpost.Match(reqpost);
string lechat = (mpost.Groups[2].Value).ToString();

但不是其他我喜欢在 textbox 中添加 meow ,在第二个文本框中添加 meow2 ,在最后一个中添加 9.0(分钟)

最佳答案

在这些情况下,Html 解析器可以提供很多帮助,而且可以更加精确和健壮

Html Agility pack

示例

var html = @"<div class=""ewok-rater-header-section"">
<li><h1>meow</h1></li>
<li><h1>meow2</h1></li>
<li><h1>Time = <span class=""work-weight"">9.0 minutes</span></h1></li>
</div>";

var doc = new HtmlDocument();
doc.LoadHtml(html);

// you can search for the heading
foreach (var node in doc.DocumentNode.SelectNodes("//li//h1"))
{
Console.WriteLine("Found heading : " + node.InnerText);
}

// or you can be more specific
var someSpan = doc.DocumentNode
.SelectNodes("//span[@class='work-weight']")
.FirstOrDefault();

Console.WriteLine("Found span : " + someSpan.InnerText);

输出

Found heading : meow
Found heading : meow2
Found heading : Time = 9.0 minutes
Found span : 9.0 minutes

Demo here

关于c# 正则表达式在一些 html 标签中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49827115/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com