- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试为字符串测试制作一个正则表达式。
基本上我想要的是something-something
。
'a' ===> TRUE
'abc' ===> TRUE
'a-b' ===> TRUE
'-' ===> FALSE
'a-' ===> FALSE
'-b' ===> FALSE
于是这个正则表达式的第一个版本诞生了。
/^[\w]+[-\s]?[\w]+$/
它工作正常,但如果字符串只有一个字母,它不会通过。
'a', failed
所以我修改了模式
^[\w]+([-\s]?[\w]+)*$
它工作正常,但如果测试的字符串很长(比如 20 多个字母),浏览器会挂起,是的,我知道那里发生了什么,灾难性回溯
。
那么在这种情况下,我该如何改进呢?
我想我错过了一个场景,它应该也支持重复组。
aaa aaa aaa aaa ===> TRUE
aaa-aaa aaa-aaa ===> TRUE
这就是为什么我用方括号制作组。
最佳答案
您遇到的问题是模式 ([-\s]?[\w]+)*
中的两次重复 - 您允许一个或多个 \w
和 一个可选的空格或破折号。该组也重复零次或多次,这将导致 catastrophic backtracking因为可选的 [-\s]
意味着有很多方法可以匹配相同的输入。例如abc
可以匹配(\w\w\w)
, (\w\w)(\w)
, (\w)(\w\w)
、(\w)(\w)(\w)
和正则表达式引擎将尝试所有这些可能性,因为模式 ([-\s]?[\w]+)*
(或者通过删除破折号使其更明显 ([\w]+)*
) 允许它.
当模式的结尾无法匹配时,将尝试所有可能性。例如,输入 "aaa-"
- 最后一个 -
将失败,但正则表达式引擎将继续回溯并检查所有排列。
相反,您可以将正则表达式简化为此
/^\w+(?:[-\s]\w+)*$/
[\w]
不需要字符类 - 如果其中只有一项。这不会改变任何内容,但删除方括号会使其更易于阅读。(?:)
。\w+
(一个或多个单词字符)或者完整的\w+[-\s]\w+
。引擎不会被迫重试失败的匹配。最后一步是解决问题,其他只是轻微的清理。重要的是模式是受限制的,它不允许多种方式来匹配错误的输入 - [-\s]
和 \一样是强制的 w+
(至少一个),因此重复组 (?:[-\s]\w+)*
不会有重叠匹配。如果我们手动展开为([-\s]\w\w\w)
,([-\s]\w\w)([-\s]\w)
和 ([-\s]\w)([-\s]\w\w)
很容易看出这不会匹配相同的输入。
const regex = /^\w+(?:[-\s]\w+)*$/;
const valid = [
'a',
'abc',
'a-b',
'aaa aaa aaa aaa',
'aaa-aaa aaa-aaa',
'a'.repeat(100),
`a-${'a'.repeat(100)}`,
`a-${'a'.repeat(100)}-${'a'.repeat(100)}`,
`a-${'a'.repeat(100)}-${'a'.repeat(100)}`,
`a ${'a'.repeat(100)} ${'a'.repeat(100)}`,
`a ${'a '.repeat(100)}a`,
]
const invalid = [
'-',
'a-',
'-b',
'aaa aaa aaa aaa-',
`a-${'a'.repeat(100)}-${'a'.repeat(100)}-`,
`a ${'a'.repeat(100)} ${'a'.repeat(100)} `,
`a-${'-'.repeat(100)}`,
`a ${' '.repeat(100)}`,
`a-${'-'.repeat(100)}a`,
`a ${'a '.repeat(100)}`,
`-${'a'.repeat(100)}`,
` ${'a'.repeat(100)}`,
`${'a'.repeat(100)}-`,
`${'a'.repeat(100)} `,
`a-${'a'.repeat(100)}-${'a'.repeat(100)}-`,
`a-${'-'.repeat(100)}`,
`a-${'a-'.repeat(100)}`,
`-${'a'.repeat(100)}`,
`${'a'.repeat(100)}-`,
]
console.log('---- VALID ----');
for (const s of valid)
test(s);
console.log('---- INVALID ----');
for (const s of invalid)
test(s);
function test(str) {
console.log(`${str} ===> ${regex.test(str)}`);
}
关于javascript - 如何避免 RegExp 中的灾难性回溯?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62709280/
在我的类里面,我学习了 Prolog 回溯算法和 Rete forprop 算法,但我也被告知 Rete 可用于进行反向传播。 这是如何运作的?它在哪些方面与 Prolog 回溯相似/不同? 例如,这
两个 friend P1 和 P2 向共同的 friend P3 发送相同的消息 M。 然而由于一些网络损坏,P3 一次只能接收一个字符不知道接收到的字符是属于 P1 还是 P2。 此外,P3 可能会
我最近发了几个理解递归和回溯的问题,我觉得我现在得到了一些东西,并尝试编写一个测试,我确实解决了数独问题,但是当我以另一种格式编写代码时,代码卡了一会儿,返回False,说明这个问题无解。 grid
有人可以指导我或解释如何在 LISP 中执行回溯吗?任何示例或链接将不胜感激。我确实尝试过谷歌,但是他们都没有足够简单的例子让我理解。 谢谢 最佳答案 典型的方法是将不可变状态向下传递到调用堆栈,辅助
我正在使用 apache 2.2.14 运行 Backtrack 5 R2 (ubuntu) 的完全库存安装。我尝试运行一个简单的 index.html 文件,其中包含一些 javascript 代码
如何在 Javascript 中获取回溯? 理想的特征: 入口函数名称,或匿名函数的一些有意义的标识符, 每个级别的参数列表, 行号。 这可以用标准的 ECMAScript 完成吗? 如果没有,是否可
本文首发公众号:小码A梦 回溯算法是一种常见的算法,常见用于解决排列组合、排列问题、搜索问题等算法,在一个搜索空间中寻找所有的可能的解。通过向分支不断尝试获取所有的解,然后找到合适的
Python 是否支持为每个异常/引发/断言显示相同的自定义错误消息(无论代码在哪里中断)? 我目前对它的破解使用了一个装饰器。我有一个函数main它显示回溯很好,但我希望它也打印my_var (在函
输入: 3,4,8,7,3 5,S,7,2,3, 8,5,5,8,10 9,3,3,8,7 6,10,3,G,1 目标是找到从起点(S)到目标(G)的最佳路径。 我们可以向上、向下、向左、向右移动。
我想匹配一个包含“json”(出现超过 2 次)且两个“json”之间没有字符串“from”的字符串。 For example(what I want the string match or not)
我正在尝试使用回溯方法找到熄灯游戏的解决方案。我无法理解此过程的算法。我的方法是枚举从 0 到 2n2 - 1 的所有整数,并将每个整数转换为具有 n*n 位的二进制数。然后,将其分成n2个二进制数字
所以我正在阅读这本书《服从测试山羊》,在学习 Python 时我在第六章中遇到了一个问题。它说我应该能够运行我们在本章和前一章中设置的功能测试,没有错误;但是,我不断收到我不知道如何修复的回溯。 Tr
我需要一些关于 Android 日志文件反混淆的帮助。 问题是如果我有这样的异常: ... 10-16 10:03:10.488: E/AndroidRuntime(25723): Cau
我有一个看起来像这样的表: here | there | -------+-------+ {1,1} | {1,1} | {1,1} | {2,1} | {1,1} | {1,2} |
我写了一小段代码,它应该接受一个字符数组并让它看起来像计算机正在输入文本。很简单,对吧?但是当我运行它时,Terminal 告诉我: *** stack smashing detected ***:
Python 中的堆栈跟踪显示文件路径。有什么方法可以让它们显示完全限定的函数名称吗? 例子: class Foo(object): def bar(self): raise
我决定深入学习回溯的概念,我有以下任务: 给定N个投资者,M个城市,N×M个投资者偏好矩阵P(P[i,j]=1,当第i个投资者希望在第j个城市建矿池;P[i, j] = 0 那么他是中立的,当 P[i
设 E - 图 G 中所有边的集合问题是从G中找到顶点的最小子集S,它满足条件:S = E 中每个顶点的所有出边的总和 换句话说:边是街道,我们可以在顶点上放置路灯。如果我们在一个顶点上放置一盏路灯—
我正在尝试做这个我在查找面试问题时遇到的问题。我们被问及将 r 个硬币放置在 n*m 网格上的方法数量,使得每行和每列至少包含一个硬币。 我想到了一个回溯解决方案,按行主要顺序处理网格中的每个单元格,
我使用 DexGuard混淆。我有来自崩溃日志和映射文件的堆栈跟踪。当我运行 retrace.bat 并为其提供堆栈跟踪和映射文件时,输出仍然是混淆格式。 最佳答案 您是否在使用 ProGuard 的
我是一名优秀的程序员,十分优秀!