regex - 为什么我在 BBEdit 中的搜索会导致 "stack overflow"错误？-6ren

regex - 为什么我在 BBEdit 中的搜索会导致 "stack overflow"错误？

转载作者：行者123 更新时间：2023-12-02 00:23:21

32

4

我对“堆栈溢出”错误感到困惑——“堆栈空间不足(应用程序错误代码:12246)——当我执行“全部替换”时进入 BBEdit，搜索

(@article(((?!eprint|@article|@book).)*\r)*)pmid = {(.+)}((((?!eprint|@article|@book).)*\r)*(@|\r*\z))

并替换为

\1eprinttype = {pubmed}, eprint = {\4}\5

我可以手动使用这些相同的模式，一次查找和替换一个，没有任何错误，即使匹配不再发生。我还可以通过处理较小的文件来避免错误。

我怀疑应该归咎于我低效和草率的正则表达式编码，并且希望专家帮助更有效地完成这项工作。我试图在 BibLaTeX 引用书目中找到所有条目，这些条目还没有 eprint 字段，但是有 pmid 字段，并替换 pmid 字段和相应的 e-print 规范(使用 eprint 和 eprinttype)。

更新:经过一些实验，我发现 a different approach是我唯一可以开始工作的东西。正在寻找

(?(?=@article(.+\r)+eprint = {(.+\r)+}\r*)(?!)|(@article(.+\r)+)pmid = {(.+)}((.+\r)+}\r*))

并替换为

\3eprinttype = {pubmed}, eprint = {\5}\6

成功了。唯一的问题是反向引用很脆弱，但我无法获得 named backreferences在 BBEdit 中工作。

最佳答案

可能是catastrophic backtracking由最后一部分引起:

.)*\r)*(@|\r*\z))

如果你分解并简化它，你基本上有一个 .*，一个 \r*，和另一个 \r*就在彼此旁边。现在想象一下输入末尾的一串 \r 字符:每个 \r 应该如何分布？这些小子句中的哪一个会吸收每个 \r 字符？如果你有 \r\r\r\r\r，你可以用 .* 部分吃掉所有五个 \r 并且一个都不吃完全使用 \r* 部分...或者，您可以组成任意数量的仍然匹配的排列。由于 * 是贪心的，它会首先尝试填充 .*，但如果失败，它必须继续尝试排列，直到其中一个排列有效。因此，它可能会通过不必要的回溯占用大量资源，直到最终崩溃。

我不是正则表达式优化技术方面的专家，但如果我是你，我会从那里开始。

更新:

查看 Wikipedia article on PCRE :

Unless the "NoRecurse" PCRE build option (aka "--disable-stack-for-recursion") is chosen, adequate stack space must be allocated to PCRE by the calling application or operating system. ... While PCRE's documentation cautions that the "NoRecurse" build option makes PCRE slower than the alternative, using it avoids entirely the issue of stack overflows.

所以我认为灾难性回溯是一个不错的选择。在更改 PCRE 上的构建选项之前，我会尝试通过调整您的正则表达式来解决它。

关于regex - 为什么我在 BBEdit 中的搜索会导致 "stack overflow"错误？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/9952957/

32

4

0

文章推荐： Django查询集按时间间隔聚合

文章推荐： vim - vimscript 函数输出中显示不需要的控制字符

文章推荐： haskell - 请更正我对 Maybe Monad 的使用

npm 安装不起作用 | npm 错误!路径 | npm 错误!代码 | npm 错误!错误 | npm 错误!系统调用 | npm 错误!恩恩特
我已经使用 vue-cli 两个星期了，直到今天一切正常。我在本地建立这个项目。 https://drive.google.com/open?id=0BwGw1zyyKjW7S3RYWXRaX24tQ
python - pytesseract 错误 Windows 错误 [错误 2]
您好，我正在尝试使用 python 库 pytesseract 从图像中提取文本。请找到代码: from PIL import Image from pytesseract import image_
C 错误 TLS 错误
我的错误 /usr/bin/ld: errno: TLS definition in /lib/libc.so.6 section .tbss mismatches non-TLS reference
r - 错误 `contrasts' 错误
我已经训练了一个模型，我正在尝试使用 predict函数但它返回以下错误。 Error in contrasts<-(*tmp*, value = contr.funs[1 + isOF[nn]])
postgresql - PowerBI 直接查询连接到 PostgreSQL 错误。 OLE 或 ODBC 错误 : [Expression. 错误] 我们无法将表达式折叠到数据源
根据Microsoft DataConnectors的信息我想通过 this ODBC driver 创建一个从 PowerBi 到 PostgreSQL 的连接器使用直接查询。我重用了 Micros
java - Android MediaPlayer 错误(在状态 1 中开始调用；错误 (-38, 0)；错误 (-38,0))
我已经为 SoundManagement 创建了一个包，其中有一个扩展 MediaPlayer 的类。我希望全局控制这个变量。这是我的代码: package soundmanagement; impo
heroku - PG::错误:错误:Heroku的内存不足
我在Heroku上部署了一个应用程序。我正在使用免费服务。我经常收到以下错误消息。 PG::Error: ERROR: out of memory 如果刷新浏览器，就可以了。但是随后，它又随机发生
.htaccess - .htaccess 错误，错误 500
我正在运行 LAMP 服务器，这个 .htaccess 给我一个 500 错误。其作用是过滤关键字并重定向到相应的域名。 Options +FollowSymLinks RewriteEngine
robocopy 错误，错误 32 (0x00000020)
我有两个驱动器 A 和 B。使用 python 脚本，我在“A”驱动器中创建一些文件，并运行 powerscript，该脚本以 1 秒的间隔将驱动器 A 中的所有文件复制到驱动器 B。我在 powe
postgresql 错误 - 错误 : input is out of range
下面的函数一直返回这个错误信息。我认为可能是 double_precision 字段类型导致了这种情况，我尝试使用 CAST，但要么不是这样，要么我没有做对...帮助？这是错误: ERROR: i
mysql - 错误 1064 MySQL 错误
这个问题已经有答案了: Syntax error due to using a reserved word as a table or column name in MySQL (1 个回答) 已关闭
mysql - mysql 错误(错误 1136)
我的数据库有这个小问题。我创建了一个表“articoli”，其中包含商品的品牌、型号和价格。每篇文章都由一个 id (ID_ARTICOLO)` 定义，它是一个自动递增字段。好吧，现在当我尝试插
c++ - 错误 C2228、错误 C2275
我是新来的。我目前正在 DeVry 在线学习中级 C++ 编程。我们正在使用 C++ Primer Plus 这本书，到目前为止我一直做得很好。我的老师最近向我们扔了一个曲线球。我目前的任务是这样的:
c++ - 错误 LNK2019 错误 C++
这个问题在这里已经有了答案: What is an undefined reference/unresolved external symbol error and how do I fix it?
html - 奇怪的 IE7 错误/错误
我的网站中有一段代码有问题；此错误仅发生在 Internet Explorer 7 中。我没有在这里发布我所有的 HTML/CSS 标记，而是发布了网站的一个版本 here . 如您所见，我在列中有
node.js - 错误!错误 : EPERM,
如果尝试在 USB 设备上构建 node.js 应用程序时在我的树莓派上使用 npm 时遇到一些问题。 package.json 看起来像这样: { "name" : "node-todo",
python - 无 Python 错误/错误？
在 Python 中，您有 None单例，在某些情况下表现得很奇怪: >>> a = None >>> type(a) >>> isinstance(a,None) Traceback (most
java - Android Studio 错误 - 错误 :java. util.concurrent.ExecutionException : com. android.tools.aapt2.Aapt2Exception:AAPT 错误
这是我的 build.gradle (Module:app) 文件: apply plugin: 'com.android.application' android { compileSdkV
android - 任务 ':app:compileDebugJavaWithJavac' 执行失败。错误 :(2055, 52) 错误 : ';' expected Error:(2055, 59) 错误:<标识符> 预期
我是 android 的新手，我的项目刚才编译和运行正常，但在我尝试实现抽屉导航后，它给了我这个错误 FAILURE: Build failed with an exception. What wen
PHP 7.2.25 错误!= 错误？
谁能解释一下？我想我正在做一些非常愚蠢的事情，并且急切地等待着启蒙。我得到这个输出: phpversion() == 7.2.25-1+0~20191128.32+debian8~1.gbp108

首页

博学

6Ren·AI

商城

regex - 为什么我在 BBEdit 中的搜索会导致 "stack overflow"错误？

更新: