gpt4 book ai didi

c# - 提取链接正则表达式 c#

转载 作者:太空宇宙 更新时间:2023-11-03 20:33:20 27 4
gpt4 key购买 nike

过去两个小时我一直在尝试解决这些问题,但似乎找不到任何解决方案。

我需要从 HTML 中提取链接文件。有 100 多个链接,但其中只有 25 个有效。

有效链接放在里面

<td><a href=" (link) ">

首先,我曾经(现在仍然)遇到逐字字符串中双引号的问题。所以,我已经用“普通”字符串逐字替换,所以我可以使用\"for "但问题是这个 Regex我写的不行

Match LinksTemp = Regex.Match(
htmlCode,
"<td><a href=\"(.*)\">",
RegexOptions.IgnoreCase);

当我得到 "<td><a href="http://www.google.com">作为输出而不是 http://www.google.com

任何人都知道如何解决这个问题以及如何在逐字字符串中使用双引号(示例 @"<>"das"sa ")

最佳答案

转义双引号示例:@"some""test"
正则表达式示例:"<a href=\"(.*?)\">"

    var match = Regex.Match(html, "<td><a href=\"(.*?)\">", 
RegexOptions.Singleline); //spelling error
var url = match.Groups[1].Value;

您可能还想使用 Regex.Matches(...)而不是 Regex.Match(...)

关于c# - 提取链接正则表达式 c#,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6313033/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com