gpt4 book ai didi

正则表达式 : How to extract html tag values in group?

转载 作者:行者123 更新时间:2023-11-30 15:05:02 25 4
gpt4 key购买 nike

上下文

我是正则表达式的新手(仍在练习),我正在尝试提取 script srclink href来自标签的值(用于教育目的)。

给出以下html

<!-- hello -->
<script src="1.js"></script>
<script src="2.js"></script>
<link rel="stylesheet" href="3.css"/>
<!-- world -->

我想得到

数组:1.js , 2.js3.css

我试过了

这是我到目前为止使用的正则表达式,但是嗯。

/(?:<!-- hello -->\s*?)([\s\S]*?)(?:\s?<!-- world -->)/gmi

当然,我必须更换[\s\S]*?有更好的东西,但我尝试了很多组合,但没有一个有效。

问候。

更新

只有 <!-- xxx --><!-- xxx--> 之间的脚本标签应该匹配。

以下不应匹配:

<!-- foo-->
<script src="4.js"></script>
<script src="5.js"></script>
<link rel="stylesheet" href="6.css"/>
<!-- bar-->

最佳答案

使用正则表达式

<!-- hello -->([\S\s]+)<!-- world -->

要提取第一组中的有效字符串,请参阅 regex demo

然后你可以使用正则表达式

<(?:script src.*|link.*href)="(\w+\.\w+)

所有比赛都在第 1 组

参见 regex demo

关于正则表达式 : How to extract html tag values in group?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45914089/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com