gpt4 book ai didi

vb.net - 正则表达式,2 个 html 标签之间的所有内容 vb.net

转载 作者:行者123 更新时间:2023-12-01 12:56:44 25 4
gpt4 key购买 nike

我正在尝试通过 visual basic 2010 上的正则表达式获取网页的一些信息

是这样的:

<SPAN CLASS="clear"></SPAN>
<h2> blabla </h2>
<h2> blabla </h2>
<b> blabla </b>

etc etc

<SPAN CLASS="clear"></SPAN>

我想要的是两者之间的一切还有 h2 标签和所有其他存在的 html 标签。

这可能吗?

我已经尝试过 (.?) 和 . 和\w* 但它没有返回任何东西...

最佳答案

最好为此使用 XML 解析器,但我假设它是一次性的或类似的。

如果我没理解错的话,这应该会获取标签之间的所有数据:

Dim regex As New Text.RegularExpressions.Regex("<.*?>", RegexOptions.Singleline)
Dim result As String = regex.Replace(yourHtml, String.Empty)

您可以使用它来获取 H2 标签和数据:

Dim regex As New Text.RegularExpressions.Regex("<\s*h2[^>]*>(.*?)<\s*/\s*h2>", RegexOptions.Singleline)
Dim results As New Text.StringBuilder
For Each m As Text.RegularExpressions.Match In regex.Matches(yourHtml)
results.Append(m.Value)
Next

关于vb.net - 正则表达式,2 个 html 标签之间的所有内容 vb.net,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9331001/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com