gpt4 book ai didi

html - 解析超链接和描述的正则表达式

转载 作者:搜寻专家 更新时间:2023-10-31 22:04:46 25 4
gpt4 key购买 nike

C#:什么是解析超链接及其描述的良好正则表达式?

请考虑不区分大小写、空格和在 HREF 标签周围使用单引号(而不是双引号)。

还请考虑获取在 <a> 中具有其他标签的超链接诸如 <b> 之类的标签和 <i> .

最佳答案

只要没有嵌套标签(也没有换行符),以下变体就可以正常工作:

<a\s+href=(?:"([^"]+)"|'([^']+)').*?>(.*?)</a>

一旦嵌套标签发挥作用,正则表达式就不适用于解析。但是,您仍然可以通过应用现代解释器的更多高级功能(取决于您的正则表达式机器)来使用它们。例如。 .NET 正则表达式使用堆栈;我发现了这个:

(?:<a.*?href=[""'](?<url>.*?)[""'].*?>)(?<name>(?><a[^<]*>(?<DEPTH>)|</a>(?<-DEPTH>)|.)+)(?(DEPTH)(?!))(?:</a>) 

来源:http://weblogs.asp.net/scottcate/archive/2004/12/13/281955.aspx

关于html - 解析超链接和描述的正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26323/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com