gpt4 book ai didi

.net - 我将如何使用正则表达式将 HTML 解析为纯文本

转载 作者:行者123 更新时间:2023-12-01 15:05:38 24 4
gpt4 key购买 nike

我将如何使用正则表达式来解析以下内容:

<b>HelloWorld</b>
<p>This is a test</p>
<a href="myUrl">Google</a>

需要去掉所有的html标签,提取超链接标签中的url,结果应该是:

HelloWorldThis is a testmyUrl

最佳答案

我知道这不是您期望的答案,但您不应该尝试使用正则表达式解析 HTML。 HTML 很难被正则表达式解析,有各种各样的东西可能出错。很难编写一个可靠地解析 HTML 的正则表达式,我什至不确定它是否可能。

使用类似于 Beautiful Soup 的东西或 HTML Agility Pack对于.NET。或者您可以使用解析器生成器创建自己的解析器。

关于.net - 我将如何使用正则表达式将 HTML 解析为纯文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/985727/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com