gpt4 book ai didi

regex - 分层正则表达式

转载 作者:行者123 更新时间:2023-12-01 10:14:45 24 4
gpt4 key购买 nike

构建匹配分层数据的单个正则表达式是否可能/实际?

例如:

<h1>Action</h1>
<h2>Title1</h2><div>data1</div>
<h2>Title2</h2><div>data2</div>
<h1>Adventure</h1>
<h2>Title3</h2><div>data3</div>

我想以比赛结束。
"Action", "Title1", "data1"
"Action", "Title2", "data2"
"Adventure", "Title3", "data3"

正如我所看到的,这需要知道这里有一个层次结构,如果我编码模式来捕获 H1,它只匹配该层次结构的第一个条目。如果我不为 H1 编码,那么我就无法捕获它。想知道我是否使用了任何特殊技巧来解决这个问题。

这是一个.NET 项目。

最佳答案

解决方案是不使用正则表达式。对于这种事情,他们还不够强大。

你想要的是一个解析器——因为看起来你正在尝试匹配 HTML,所以有很多可供选择。

关于regex - 分层正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2241350/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com