parsing - Ant : lookahead and lookbehind examples-6ren

parsing - Ant : lookahead and lookbehind examples

转载作者：行者123 更新时间：2023-12-02 04:33:46

24

4

我很难搞清楚如何识别某些文本，前提是它之前和之后都有特定的东西。任务是识别 AND、OR 和 NOT，但如果它们是单词的一部分则不是:

他们应该在这里被识别:

x AND y
(x)AND(y)
NOT x
NOT(x)

但不是这里:

xANDy
abcNOTdef

如果 AND 被空格或括号包围，则 AND 会被识别。如果它位于输入的开头，前面有一个空格，后面跟着一个空格或括号，则不会被识别。

问题是，如果我在 AND 或 NOT 的定义中包含括号，它们就会被消耗，我需要它们是单独的标记。

我可以使用某种先行/后行语法吗？

编辑:

根据评论，这里有一些上下文。问题与此问题有关:Antlr: how to match everything between the other recognized tokens?我的工作解决方案只是识别 AND、OR 等并跳过其他所有内容。然后，在第二次遍历文本时，我手动抓取未被覆盖的字符，并在其上运行一个完全不同的分词器。原因是我需要一个针对此内容的自定义的、特定于人类语言的分词器，这意味着我无法提前描述什么是 ID。每种人类语言都是不同的。我想分阶段组合单个查询语言分词器，然后将人类语言分词器应用到剩下的部分。

最佳答案

ANTLR 不是完成此任务的正确工具。普通解析器是为特定语言设计的，即由在解析器创建时已知的元素组成的一组句子。有一些方法可以使它更灵活，例如通过在谓词中使用运行时函数来识别语法中未定义的词，但这有其他(负面)影响。

你应该考虑的是NLP用于处理自然语言的不同方法。它不仅仅是跳过两个已知标记之间的内容。

关于parsing - Ant : lookahead and lookbehind examples，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/45947588/

24

4

0

文章推荐： Spring找到2个候选人，但只有一个

文章推荐： winapi - CryptUIWiz导入和保护密码

文章推荐： css - SVG Logo 作为图像与背景与内联

regex - 非贪婪的 LookAhead
我有如下字符串: val:key 我可以使用 /^\w*/ 捕获“val”。我现在如何获取“key”而不“:”符号？谢谢最佳答案这个怎么样？ /^(\w+):(\w+)$/ 或者，如果您只想捕
python - Lookahead 正则表达式无法找到相同的重叠匹配项
再次搜索相同模式时是否可以使用正则表达式找到重叠匹配项？我希望能够找到出现三次的匹配项。例如，bababa 在 babababab 中出现了 3 次: 巴巴布巴巴布 babababab 爸爸爸爸这是
JavaScript 使用 Lookahead 匹配多行中的相似模式
我正在尝试提出正则表达式 block ，该 block 将使用 JavaScript 从 cucumber 样本中提取表。 cucumber 样本如下 Feature: Sample Feature
javascript - Lookahead (?=模式) 没有前面的模式
这个问题已经有答案了: Reference - What does this regex mean? (1 个回答) 已关闭 7 年前。我了解到lookahead正则表达式是这样的x(?=y)和意味
java - 如何修复解析错误(使用 LOOKAHEAD)
我的解析器生成器(使用 javaCC)有问题我有这个错误: Warning: Choice conflict involving two expansions at line 119, c
java - 正则表达式 Lookahead 未按预期匹配
我正在编写一个小型java程序来进行一些数据库清理，当它们与某些关键字出现在同一个句子中时，我需要从大文本 block 中提取日期，并且我遇到了一些奇怪的行为想不通。例如，以下正则表达式: "(?=.
c# - 使用 Lookahead 使用正则表达式匹配字符串
我需要使用正则表达式来匹配一个字符串 holiding html 以拉出所有嵌套的跨度，我假设我假设有一种方法可以使用正则表达式来执行此操作，但整个上午都没有成功。所以对于示例输入字符串
Javacc 解析器选项 LOOKAHEAD，Java
我最近开始研究使用 javacc 的语法分析器，其中一个字段是选项 one...我有如下代码: options { LOOKAHEAD=1; } PARSER_BEGIN(Calculator)
regex - 如何转换使用 Lookahead 的正则表达式模式？
我无法将此正则表达式转换为 Golang 支持的内容。我能得到一些帮助吗？它最初来自 this SO question . ^(?=.{1,24}$)(?![_.])(?!.*[_.]{2})[a-z
Java 正则表达式 : Negative lookahead
我正在尝试制作两个匹配 URI 的正则表达式。这些 URI 的格式为:/foo/someVariableData 和 /foo/someVariableData/bar/someOtherVariab
regex - 我们需要 Lookahead/Lookbehind 零宽度断言做什么？
我刚刚更详细地了解了这两个概念。我一直对 RegEx 很好，似乎我从未见过这 2 个零宽度断言的必要性。我很确定我错了，但我不明白为什么需要这些结构。考虑这个例子: Match a 'q' whic
javascript - 使用具有特殊条件的正则表达式(lookahead/lookbehind)字符串替换哈希
让我留下以下字符串列表，在 JavaScript (NodeJS) 中，我想一次应用一个正则表达式并替换 . 和 . 之间的哈希值，但我不想替换这个词，.style。或 .bundle. 或 .chu
java - 使用 Lookahead Regex 时出现模式异常
我有以下正则表达式来验证字符串中的条件，我在在线正则表达式 validator 上编写了它，但是当我在 Java 代码中使用它时出现异常: "(^([a-z]{1,6})(?(?=(_))(([_])
parsing - Ant : lookahead and lookbehind examples
我很难搞清楚如何识别某些文本，前提是它之前和之后都有特定的东西。任务是识别 AND、OR 和 NOT，但如果它们是单词的一部分则不是: 他们应该在这里被识别: x AND y (x)AND(y) NO
java - 正则表达式: How to Combin Lookahead and Lookbehind
我有一串以逗号分隔的字符，需要拆分。不过，其中一些字符可能是逗号。例如: test = "a,b,c,d,,,e,f,g" 我知道(?
java - 无法使 Negative Lookahead 正则表达式正确匹配
我正在尝试匹配 Java 中没有 .jsp/.jspx 扩展名的字符串，并且在负向先行模式方面遇到了很多困难。给定一堆字符串: String string1 = "templateName"; St
java - javacc 中多余的 LOOKAHEAD 会导致错误吗？
我有以下TT.jj，如果我取消注释下面的SomethingElse部分，它会成功解析create create blahblah形式的语言> 或创建废话。但是，如果我注释掉下面的 SomethingE
Java 正则表达式 Lookbehind 和 Lookahead
我想创建一个可以识别字符串中的等号的正则表达式。唯一的条件是等号前面不能有以下字符:“”、“~”和“=”。它后面也不能跟这个字符“=”。我使用的正则表达式语句是这样的:(?~=])=(?=[^=])并
正则表达式 : lookbehind and lookahead and greediness problem
这应该很简单，但我是菜鸟，我一辈子也搞不懂。我正在尝试使用正则表达式来匹配特殊打开/关闭标签内的文本:[p2][/p2] 所以在这段文字中: apple [p2]banana[/p2] grape [
python - 在Keras中执行最新的 "Lookahead Optimizer"论文？
关闭。这个问题需要更多focused .它目前不接受答案。想改进这个问题吗？更新问题，使其只关注一个问题 editing this post . 关闭 3 年前。 Improve this qu

首页

博学

6Ren·AI

商城

parsing - Ant : lookahead and lookbehind examples