gpt4 book ai didi

c# - 使用正则表达式的缺点

转载 作者:行者123 更新时间:2023-11-30 13:33:39 25 4
gpt4 key购买 nike

最近我的经理建议我不要太依赖 Regex,因为它有很多缺点。当我试图了解更多信息时,我听说它存在一些问题,例如正则表达式可能会导致内存泄漏,因为一些对象即使在使用后仍继续卡在字符串引用上?

.NET RegEx "Memory Leak" investigation

所以说 reg-ex 会导致内存开销并且如果您有其他选择则不应使用是正确的吗? reg-ex 还有其他不利条件吗(除了它很难学 :))

P.S 我正在开发一个类似于网络爬虫的应用程序 (c#.net),它提取所有 href 和一些其他信息,如标题、元标记等。我可以选择使用 HTML Agility pack 而不是 reg-ex。

最佳答案

使代码难以阅读。大多数时候,即使以拥有更冗长的代码为代价,最好不要使用正则表达式。代价高昂的性能影响和代码可读性的下降意味着您在大多数情况下不使用正则表达式,尤其是较简单的和复杂的。

对于您提到的目的(解析 HTML 等),简单的正则表达式无法完成工作(因为 HTML 不是常规语言)。就好比拿着锤子,看什么都是钉子。

关于c# - 使用正则表达式的缺点,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6505409/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com