gpt4 book ai didi

regex - 通过正则表达式从 Oracle 中的字符串中删除简单的 HTML 标签,需要解释

转载 作者:行者123 更新时间:2023-12-04 11:04:13 26 4
gpt4 key购买 nike

我不明白,为什么我的 reg1 和 reg2 列从我的字符串中删除了“bbb”,而只有 reg3 按预期工作。

WITH t AS (SELECT 'aaa <b>bbb</b> ccc' AS teststring FROM dual)

SELECT
teststring,
regexp_replace(teststring, '<.+>') AS reg1,
regexp_replace(teststring, '<.*>') AS reg2,
regexp_replace(teststring, '<.*?>') AS reg3
FROM t


TESTSTRING REG1 REG2 REG3
aaa <b>bbb</b> ccc aaa ccc aaa ccc aaa bbb ccc

非常感谢!

最佳答案

因为默认情况下正则表达式是贪婪的。 IE。表达式 .*.+尝试使用尽可能多的字符。因此 <.+>将从第一个 < 开始到最后 > .使用惰性运算符 ? 使其惰性:

regexp_replace(teststring, '<.+?>')

或者
regexp_replace(teststring, '<.*?>')

现在,搜索 >将停在第一个 >遭遇。

请注意 .包括 >同样,因此贪婪变体(没有 ? )吞噬了所有 >但最后。

关于regex - 通过正则表达式从 Oracle 中的字符串中删除简单的 HTML 标签,需要解释,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30756921/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com