- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
我正在尝试用 JavaScript 编写一个词法分析器来查找简单的特定领域语言的标记。我从一个简单的实现开始,它只是尝试匹配一行中当前位置的后续正则表达式,以确定它是否匹配某种标记格式并接受它。
问题是,当这样的正则表达式中的某些内容不匹配时,整个正则表达式都会失败,所以我不知道究竟是哪个字符导致它失败。
有没有办法找出导致正则表达式失败的字符串中的位置?
INB4:我不是在询问调试我的正则表达式并验证其正确性。它已经是正确的,匹配正确的字符串并丢弃不正确的字符串。我只想以编程方式知道正则表达式停止匹配的确切位置,找出用户输入中不正确的字符的位置,以及其中有多少是好的。
有没有办法只用简单的正则表达式而不是继续实现一个成熟的有限状态自动机?
最佳答案
简答
There is no such thing as a "position in the string that causes the regular expression to fail".
At which token in the regex did the engine become unable to match the string?
the position in the string which caused the regular expression to fail
的问题是颠倒的。当引擎用左手向下移动字符串并用右手向下移动模式时,一个匹配六个字符的正则表达式标记可以稍后,由于量词和回溯,在下一个匹配零个字符 - 或扩展以匹配十。
At which token in the regex did the engine become unable to match the string?
^\w+\d+$
和字符串
abc132z
.
\w+
实际上可以匹配整个字符串。然而,整个正则表达式都失败了。说正则表达式在字符串末尾失败是否有意义?我不这么认为。考虑一下。
\w+
将匹配
abc132z
.然后引擎前进到下一个 token :
\d+
.在这个阶段,引擎在字符串中回溯,逐渐让
\w+
放弃
2z
(因此
\w+
现在只对应于
abc13
),允许
\d+
匹配
2
.
$
断言失败,因为
z
离开了。引擎回溯,让
\w+
,放弃
3
字符,然后是
1
(因此
\w+
现在只对应于
abc
),最终允许
\d+
匹配
132
.在每一步,引擎都会尝试
$
断言和失败。根据引擎内部结构,可能会发生更多回溯:
\d+
将再次放弃 2 和 3,然后
\w+
将放弃c和b。当引擎最终放弃时,
\w+
仅匹配初始
a
.你能说正则表达式“在“3”上失败了吗?在“b”上?
$
上失败了。 ,因为它是我们无法添加到匹配中的第一个标记。请记住,还有其他方法可以证明这一点。
At which token in the regex did the engine become unable to match the string?
^(?:(?=(\w+)))?(?:(?=(\w+\d+)))?(?:(?=(\w+\d+$)))?.
^(?=(\w+))?(?=(\w+\d+))?(?=(\w+\d+$))?.
\w+
token \w+\d+
,因此,它会逐步测试 \d+
token \w+\d+$
,因此,它会逐步测试 $
token abc123a
),您可以说
$
导致失败。如果设置了组 1 但未设置组 2(如
abc
),您可以说
\d+
导致失败。
关于javascript - 找出正则表达式失败的位置,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23839481/
我在使用以下代码时遇到问题: function http_file_exists($url){ $f=fopen($url,"r"); if($f){ fclose($f); retu
我已经通过 Git 部署到 Azure 几个月了,没有出现重大问题,但现在我似乎遇到了一个无法克服的错误。 我创建了一个新的 Azure 网站,为正在开发的项目创建单独的预览链接。我在新站点上设置了
我已经通过flutter创建了一个App并完成了它,我想在flutter文档中阅读时进行部署。 我收到此错误: FAILURE: Build failed with an exception. * W
我在Windows 10中使用一些简单的Powershell代码遇到了这个奇怪的问题,我认为这可能是我做错了,但我不是Powershell的天才。 我有这个: $ix = [System.Net.Dn
我正在尝试使用 RapidJSON 解析从服务器接收到的数据。以下是收到的确切字符串: [ { "Node": "9478149a08f9", "Address": "172.17
我尝试为 ios 编译 OpenCV。我总是收到这些错误。我用不同版本的opencv试了一下,结果都是一样的。 我运行这个:python 平台/ios/build_framework.py ios_o
我在一台机器上做基本的发布/订阅,我的客户端是 StackExchange-Redis 的 C# 客户端,我在同一台机器上运行基于 Windows 的 Redis 服务器(服务器版本 2.8.4) 当
我有这段代码,但无法执行,请帮我解决这个问题 连接 connect_error) { die ("connection failed: " . $terhubung->connect_erro
我在 tomcat 上运行并由 maven 编译的 Web 应用程序给出了以下警告和错误。我可以在本地存储库中看到所有 JAR,但有人可以帮忙吗。 WARNING: Failed to scan JA
我正在 Windows 8 上使用 Android Studio 开发一个 android 应用程序,我正在使用一些 native 代码。突然间我无法编译我的 C 文件。当我运行 ndk-build
下面的代码对类和结构的成员进行序列化和反序列化。序列化工作正常,但我在尝试使用 oarch >> BOOST_SERIALIZATION_NVP(outObj); 反序列化时遇到了以下错误; 代码中是
如果我运行此命令“rspec ./spec/requests/api/v1/password_reset_request_spec.rb”,此文件中的所有测试都会通过。 但是,当我运行“rspec”时
我在尝试执行测试以使用 Protractor 上传文件时出错,我的代码是这个 it('it should be possible to upload a file', function() {
System.loadLibrary("nativefaceswap"); 当我运行我的应用程序时,我在 Android Studio 中发现了此类错误。在logcat中显示: java.lang.U
我希望有人能帮助我!使用任何方法或命令行的任何 SSL/HTTPS 调用均无效。 我在 Windows 10 中使用 Ubuntu Server 18.04 作为子系统。我的问题是昨天才开始出现的,因
通过删除这两个值将日期字段从 null=True 和 Blank=True 更改为 required 时,使用 db.alter 命令时遇到问题。 当以下行被注释掉时,迁移运行不会出现问题。
我第一次使用 Heroku 尝试创建应用程序(使用 SendGrid 的 Inbound Parse Webhook"和 Twilio SMS 通过电子邮件发送和接收 SMS 消息)。通过 Virtu
我正在将我的 swift 项目更新到 Xcode 7 上的 Swift 2.0。xcode 在构建项目时报告了以下错误: 命令/Applications/Xcode.app/Contents/Deve
在我的代码中,SSL 库函数 SSL_library_init() 没有按预期返回 1。我如何才能看到它返回了什么错误? 我在 SSL_library_init() 之后调用了 SSL_load_er
我正在尝试运行在以下链接中找到的答案: Asynchronously Load the Contents of a Div 但是当我这样做时,我会遇到我不太理解的错误。 我的代码: $(documen
我是一名优秀的程序员,十分优秀!