gpt4 book ai didi

c++ - QRegExp 一次匹配包含 N 个单词的行,但不考虑顺序(即逻辑与)

转载 作者:塔克拉玛干 更新时间:2023-11-03 02:04:04 31 4
gpt4 key购买 nike

我有一个包含多行文本的文件,我只想匹配那些包含多个单词的行。 所有单词都必须出现在行中,但它们可以以任何顺序出现

所以如果我们想匹配一个两个三个,下面的前两行将被匹配:

three one four two <-- match
four two one three <-- match
one two four five
three three three

这可以使用 QRegExp 来完成吗(不拆分文本并为每个单词单独测试每一行)?

最佳答案

是的,这是可能的。使用lookahead .这将检查主题字符串的以下部分,而不实际使用它们。这意味着在先行完成后,正则表达式引擎将跳回到它开始的地方,您可以运行另一个先行(当然在这种情况下,您从字符串的开头使用它)。试试这个:

^(?=[^\r\n]*one)(?=[^\r\n]*two)(?=[^\r\n]*three)[^\r\n]*$

取反字符类 [^\r\n] 确保我们永远不会越过行尾。因为前瞻实际上并不为匹配消耗任何东西,所以我们在末尾(前瞻之后)添加 [^\r\n]* 并为匹配添加 $队伍的尽头。事实上,由于 * 的贪婪性,您可以省略 $,但我认为这会使表达式的含义更加明显。

确保在多行模式下使用此正则表达式(以便 ^$ 匹配行的开头)。

编辑:

抱歉,显然是 QRegExp does not support multi-line mode m :

QRegExp does not have an equivalent to Perl's /m option, but this can be emulated in various ways for example by splitting the input into lines or by looping with a regexp that searches for newlines.

它甚至建议将字符串拆分成行,这是您要避免的。

由于 QRegExp 也不支持 lookbehinds(这将有助于模拟 m),其他解决方案就有点棘手了。你可以去

(?:^|\r|\n)(?=[^\r\n]*one)(?=[^\r\n]*two)(?=[^\r\n]*three)([^\r\n]*)

那么你想要的行应该在捕获组 1 中。但我认为将字符串拆分为多行可能会产生比这更具可读性的代码。

关于c++ - QRegExp 一次匹配包含 N 个单词的行,但不考虑顺序(即逻辑与),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13690571/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com