- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在为查询引擎编写一个解析器。我的解析器 DCG 查询
不是确定性的。
我将以关系方式使用解析器来检查和综合查询。
解析器 DCG 不具有确定性是否合适?
如果我希望能够以两种方式使用 query/2,是否需要这样做
?- phrase(query, [q,u,e,r,y]).
true;
false.
或者我应该能够获得
?- phrase(query, [q,u,e,r,y]).
true.
尽管如此,鉴于第一个片段需要我这样使用它
?- bagof(X, phrase(query, [q,u,e,r,y]), [true]).
true.
什么时候用它来检查公式?
最佳答案
要问自己的第一个问题是你的语法是确定性的,或者用语法术语来说,unambiguous 。这并不是问你的 DCG 是否是确定性的,而是问语法是否明确。这可以用基本的解析概念来回答,不需要使用 DCG 来回答这个问题。换句话说,是否只有一种方法可以解析有效的输入。这方面的标准书籍是“编译器:原理、技术和工具”( WorldCat )
现在您实际上是在询问解析的三种不同用途。
如果你的语法明确,那么
所有这一切都可以用一个 DCG 来完成吗?是的。三种不同的方式取决于您如何使用 DCG 的输入和输出。
<小时/>这是一个语法非常简单的示例。
语法只是一个带有一个运算符和两个可能的操作数的中缀二进制表达式。运算符为 (+),操作数为 (1) 或 (2)。
expr(expr(Operand_1,Operator,Operand_2)) -->
operand(Operand_1),
operator(Operator),
operand(Operand_2).
operand(operand(1)) --> "1".
operand(operand(2)) --> "2".
operator(operator(+)) --> "+".
recognizer(Input) :-
string_codes(Input,Codes),
DCG = expr(_),
phrase(DCG,Codes,[]).
parser(Input,Ast) :-
string_codes(Input,Codes),
DCG = expr(Ast),
phrase(DCG,Codes,[]).
generator(Generated) :-
DCG = expr(_),
phrase(DCG,Codes,[]),
string_codes(Generated,Codes).
:- begin_tests(expr).
recognizer_test_case_success("1+1").
recognizer_test_case_success("1+2").
recognizer_test_case_success("2+1").
recognizer_test_case_success("2+2").
test(recognizer,[ forall(recognizer_test_case_success(Input)) ] ) :-
recognizer(Input).
recognizer_test_case_fail("2+3").
test(recognizer,[ forall(recognizer_test_case_fail(Input)), fail ] ) :-
recognizer(Input).
parser_test_case_success("1+1",expr(operand(1),operator(+),operand(1))).
parser_test_case_success("1+2",expr(operand(1),operator(+),operand(2))).
parser_test_case_success("2+1",expr(operand(2),operator(+),operand(1))).
parser_test_case_success("2+2",expr(operand(2),operator(+),operand(2))).
test(parser,[ forall(parser_test_case_success(Input,Expected_ast)) ] ) :-
parser(Input,Ast),
assertion( Ast == Expected_ast).
parser_test_case_fail("2+3").
test(parser,[ forall(parser_test_case_fail(Input)), fail ] ) :-
parser(Input,_).
test(generator,all(Generated == ["1+1","1+2","2+1","2+2"]) ) :-
generator(Generated).
:- end_tests(expr).
语法是明确的,并且只有 4 个有效字符串,而且都是唯一的。
识别器是确定性的,仅返回 true 或 false。
解析器是确定性的并返回唯一的 AST。
生成器是半确定性的,并返回所有 4 个有效的唯一字符串。
测试用例的运行示例。
?- run_tests.
% PL-Unit: expr ........... done
% All 11 tests passed
true.
<小时/>
对丹尼尔的评论进行一些扩展
正如丹尼尔所说
1 + 2 + 3
可以解析为
(1 + 2) + 3
或
1 + (2 + 3)
所以 1+2+3
是一个例子,正如您所说的由递归 DCG 指定
,正如我指出的,解决问题的常见方法是使用括号开始一个新的上下文。开始一个新的上下文意味着它就像获得一个新的 clean slate重新开始。如果您要创建 AST,只需将新的上下文、项目放在括号之间,作为当前节点的新子树。
关于write_canonical/1 ,这也很有帮助,但要注意运算符的左右结合性。请参阅Associative property
例如
+
左关联
?- write_canonical(1+2+3).
+(+(1,2),3)
true.
^
是右结合的
?- write_canonical(2^3^4).
^(2,^(3,4))
true.
即
2^3^4 = 2^(3^4) = 2^81 = 2417851639229258349412352
2^3^4 != (2^3)^4 = 8^4 = 4096
此添加信息的目的是警告您,语法设计充满了隐藏的陷阱,如果您没有上过严格的类(class)并完成了其中的一些操作,您可以轻松创建一个看起来很棒并且效果很好的语法,并且然后几年后发现有一个严重的问题。 AFAIK 虽然 Python 并不含糊,但它确实存在语法问题,它的问题已经足够多了,以至于当 Python 3 创建时,许多问题都得到了修复。因此 Python 3 不向后兼容 Python 2 ( differences )。是的,他们已经进行了更改和库,以便更轻松地在 Python 3 中使用 Python 2 代码,但重点是语法在设计时可以使用更多的分析。
关于parsing - 解析器 DCG 不具有确定性是否合适?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57299097/
这个答案:Very basic dcg prolog syntax对我有一点帮助,但 [X] 只能得到下一个字符,我想要整个辣酱 Jade 米饼馅,继续阅读! 我正在使用 GNU Prolog 编写一
在此 site ,我找到了解释如何使用 DCG 构建右手上下文符号的部分 A → ε | a A Head, [T_1,...,T_n] --> Body. 有人帮助我通过示例找出这种方法并说明它解析
我知道 Prolog 程序员通常使用 DCG 而不是正则表达式来匹配字符串中的模式。在 Perl 中,可以这样写 if ( '... accd' =~ /a+b*c{2,4}d$/ ) { s
我在创建问答 Prolog 文件时遇到问题。我有一个包含位置的数据库,我已经可以得到问题并写出答案。但是有不同类型的对象,需要不同的前缀。所以我为前缀定义了 DCG。 answer(P,A) :- l
我有两个人的 DCG 句子,分别代表一个男性和一个女性。我想用“他”或“她”来指代前一句中提到的人。 假设我们有这些 DCG: father --> [Peter]. mother --> [Isab
假设我将“a-list”称为零个或多个“a”的列表: % as = [a,a,a] as --> []. as --> [a], as. 假设我想表示一个“b-list”,一个由零个或多个 a-lis
我有一个手动制定的 DCG 规则来选择惯用短语超过单个单词。 DCG规则如下: seq(cons(X,Y), I, O) :- noun(X, I, H), seq(Y, H, O), \+ noun
我正在玩 DCG,我有这段代码。这将显示 x 个 0 和 x 个 A。 y --> test(Count), as(Count). test(0) --> []. test(succ(0)) -->
你好,我是 Prolog 和 DGC 的新手。我想编写一个 DCG 来解析时间表达式,例如 10.20 am 或 12 oclock。我如何检查 10.20 am 对于 Olcock 是否是有效表达式
最近我一直在 Prolog 中使用 DCG,但我一直面临一些关于它究竟如何工作的问题。例如,我有这个小语法: :: | :: | | | :: 'a' | 'b' ... |'Z
我开始学习如何使用 DCG。我想知道花括号 {...} 的用途是什么?何时(何时不)需要它们?例如: read_lines --> { read_line_to_codes(current_inp
我正在尝试为一个有效号码指定一个 DCG,该号码将像这样使用: value(Number) --> valid_number(Number). 基本上检查一个指定的值是否是数字,(它也可能是一个变量,
假设我想编写一个自定义运算符,用于以重复的方式编写 DCG 规则。 例如,假设我有一个 DCG,ws使得: ws --> []. ws --> " ", ws. 匹配零个或多个空格。显然,如果我想在我
我在 SWI Prolog 中编写了一个程序来测试字符串是否是回文。 DCG 中的这个任务我能够弄清楚,而且非常简单。 palindrome --> [X], palindrome, [X]. pa
所以我正在使用 Definite Clause Grammars 在 SWI-Prolog 中为 Pascal 编写一个简单的解析器。 我不明白如何实现重复(2 个或更多)或可选地重复(1 个或更多)
我正在构建一个明确的从句语法来解析 20,000 条半自然文本。随着我的谓词数据库的大小增长(现在多达 1,200 条规则),解析一个字符串可能需要相当长的时间——特别是对于 DCG 当前无法解释的字
在我看来,应该能够使用字节列表上的 DCG 处理二进制数据。但是,要使其正常工作,必须使用按位运算,这意味着 is/2涉及,这意味着实例化顺序是一个问题,这可能会混淆使用 DCG 进行解析和生成。这里
我目前有一个包含几个人和一些关系谓词的小型 Prolog 数据库。例如: female(anna). female(susan). male(john). male(timmy). siblings(
我正在为查询引擎编写一个解析器。我的解析器 DCG 查询 不是确定性的。 我将以关系方式使用解析器来检查和综合查询。 解析器 DCG 不具有确定性是否合适? 在代码中: 如果我希望能够以两种方式使用
我需要使用 swi-prolog 中的规则拆分二氯戊烷这就是我尝试做的 stem--> [meth]|[eth]|[prop]|[but]|[pent]. suf --> [ane]|[ene]|[y
我是一名优秀的程序员,十分优秀!