- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我一直在学习ANTLR,以创建特定领域的语言。要求之一就是将DSL转换为C。我已经能够获得识别DSL的基本语法,但是我在将其转换为C时遇到了问题。主要是,我的问题来自尝试将DSL if语句转换为C。 C if语句。我试图在语法中使用打印语句,但无济于事(我正在使用C#)。
这是我一直在测试的语法:
**ifTest.g**
grammar ifTest;
options
{
backtrack=true;
output=AST;
language=CSharp2;
}
/*************************
PARSER RULES
*************************/
prog : lambda
| statements EOF;
lambda : /* Empty */;
statements
: statement+;
statement
: logical
| assignment
| NEWLINE;
logical : IF a=logical_Expr THEN b=statements
{
System.Console.Write("\tif (" + $a.text + ")\n\t{\n\t" + "\t" + $b.text + "\n\n\t}");
}
( ELSE c=statements
{
System.Console.Write("\n\telse {\n\t\t\t" + $c.text + "\n\t}");
} )?
ENDIF
{
System.Console.Write("\n}");
}
;
logical_Expr
: expr
;
expr : (simple_Expr) (op expr)*
;
simple_Expr : MINUS expr
| identifier
| number
;
identifier : parameter
| VARIABLE
;
parameter : norm_parameter
;
norm_parameter : spec_label
| reserved_parm
;
spec_label : LABEL
;
reserved_parm : RES_PARM
;
op : PLUS
| MINUS
| MULT
| DIV
| EQUALS
| GT
| LT
| GE
| LE
;
number : INT
| FLOAT
| HEX
;
assignment : identifier GETS expr
;
/*************************
LEXER RULES
*************************/
WS : (' '|'\t')+ {$channel=HIDDEN;};
COMMENT : '/*' (options {greedy=false;}:.)* '*/' {$channel=HIDDEN;}
;
LINECOMMENT
: '#' ~('\n'|'\r')* NEWLINE {$channel=HIDDEN;}
;
NEWLINE : '\r'?'\n' {$channel=HIDDEN;};
IF : I F;
THEN : T H E N;
ELSE : E L S E;
ENDIF : E N D I F;
PLUS : '+';
MINUS : '-';
MULT : '*';
DIV : '/';
EQUALS : '=';
GT : '>';
LT : '<';
GE : '>=';
LE : '<=';
ULINE : '_';
DOT : '.';
GETS : ':=';
LABEL : (LETTER|ULINE)(LETTER|DIGIT|ULINE)*;
INT : '-'?DIGIT+;
FLOAT : '-'? DIGIT* DOT DIGIT+;
HEX : ('0x'|'0X')(HEXDIGIT)HEXDIGIT*;
RES_PARM: DIGIT LABEL;
VARIABLE: '\$' LABEL;
fragment A:'A'|'a'; fragment B:'B'|'b'; fragment C:'C'|'c'; fragment D:'D'|'d';
fragment E:'E'|'e'; fragment F:'F'|'f'; fragment G:'G'|'g'; fragment H:'H'|'h';
fragment I:'I'|'i'; fragment J:'J'|'j'; fragment K:'K'|'k'; fragment L:'L'|'l';
fragment M:'M'|'m'; fragment N:'N'|'n'; fragment O:'O'|'o'; fragment P:'P'|'p';
fragment Q:'Q'|'q'; fragment R:'R'|'r'; fragment S:'S'|'s'; fragment T:'T'|'t';
fragment U:'U'|'u'; fragment V:'V'|'v'; fragment W:'W'|'w'; fragment X:'X'|'x';
fragment Y:'Y'|'y'; fragment Z:'Z'|'z';
fragment DIGIT
: '0'..'9';
fragment LETTER
: A|B|C|D|E|F|G|H|I|J|K|L|M|N|O|P|Q|R|S|T|U|V|W|X|Y|Z;
fragment HEXDIGIT
: '0..9'|'a..f'|'A'..'F';
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using Antlr.Runtime;
namespace ConsoleApplication1
{
class Program
{
static void Main(string[] args)
{
string inputString = "if $variable1 = 0 then\n if $variable2 > 250 then\n $variable3 := 0\n endif\n endif";
Console.WriteLine("Here is the input string:\n " + inputString + "\n");
ANTLRStringStream input = new ANTLRStringStream(inputString);
ifTestLexer lexer = new ifTestLexer(input);
CommonTokenStream tokens = new CommonTokenStream(lexer);
ifTestParser parser = new ifTestParser(tokens);
parser.prog();
Console.Read();
}
}
}
**Output**
if ($variable2 > 250)
{
$variable3 := 0
}
} if ($variable1 = 0)
{
if $variable2 > 250 then
$variable3 := 0
endif
}
}
if ($variable1 = 0)
{
if ($variable2 > 250)
{
$variable3 := 0
}
}
最佳答案
如果删除回溯(在您的情况下很容易做到),则可以让解析器立即构建C代码。
请注意,解析器规则可以采用参数(在下面的示例中为缩进级别),并且可以返回自定义对象(示例中为String
):
这是您的语法,无需回溯并输出到C代码(我不太擅长C#,因此演示使用Java):
grammar ifTest;
prog
: statements[""] EOF {System.out.println($statements.str);}
;
statements[String indent] returns [String str]
@init{$str = "";}
: (statement[indent] {$str += indent + $statement.str + "\n";})*
;
statement[String indent] returns [String str]
: if_statement[indent] {$str = $if_statement.str;}
| assignment {$str = $assignment.str;}
;
if_statement[String indent] returns [String str]
: IF expr THEN s1=statements[indent + " "] {$str = "if (" + $expr.str + ")\n" + indent + "{\n" + $s1.str;}
(ELSE s2=statements[indent + " "] {$str += indent + "}\n" + indent + "else\n" + indent + "{\n" + $s2.str;} )?
ENDIF {$str += indent + "}";}
;
assignment returns [String str]
: identifier GETS expr {$str = $identifier.str + " = " + $expr.str + ";";}
;
expr returns [String str]
: rel_expr {$str = $rel_expr.str;}
;
rel_expr returns [String str]
: e1=eq_expr {$str = $e1.str;} ( LT e2=eq_expr {$str += " < " + $e2.str;}
| GT e2=eq_expr {$str += " > " + $e2.str;}
| LE e2=eq_expr {$str += " <= " + $e2.str;}
| GE e2=eq_expr {$str += " >= " + $e2.str;}
)?
;
eq_expr returns [String str]
: e1=add_expr {$str = $e1.str;} (EQUALS e2=add_expr {$str += " == " + $e2.str;})?
;
add_expr returns [String str]
: e1=mult_expr {$str = $e1.str;} ( PLUS e2=mult_expr {$str += " + " + $e2.str;}
| MINUS e2=mult_expr {$str += " - " + $e2.str;}
)*
;
mult_expr returns [String str]
: e1=unary_expr {$str = $e1.str;} ( MULT e2=unary_expr {$str += " * " + $e2.str;}
| DIV e2=unary_expr {$str += " / " + $e2.str;}
)*
;
unary_expr returns [String str]
: MINUS term {$str = "-" + $term.str;}
| term {$str = $term.str;}
;
term returns [String str]
: identifier {$str = $identifier.str;}
| number {$str = $number.text;}
;
identifier returns [String str]
: LABEL {$str = $LABEL.text;}
| RES_PARM {$str = $RES_PARM.text;}
| VARIABLE {$str = $VARIABLE.text.substring(1);}
;
number
: INT
| FLOAT
| HEX
;
WS : (' '|'\t')+ {$channel=HIDDEN;};
COMMENT : '/*' .* '*/' {$channel=HIDDEN;};
LINECOMMENT : '#' ~('\n'|'\r')* NEWLINE {$channel=HIDDEN;};
NEWLINE : '\r'?'\n' {$channel=HIDDEN;};
IF : I F;
THEN : T H E N;
ELSE : E L S E;
ENDIF : E N D I F;
PLUS : '+';
MINUS : '-';
MULT : '*';
DIV : '/';
EQUALS : '=';
GT : '>';
LT : '<';
GE : '>=';
LE : '<=';
ULINE : '_';
DOT : '.';
GETS : ':=';
LABEL : (LETTER | ULINE) (LETTER | DIGIT | ULINE)*;
INT : DIGIT+; // no '-' here, unary_expr handles this
FLOAT : DIGIT* DOT DIGIT+; // no '-' here, unary_expr handles this
HEX : '0' ('x'|'X') HEXDIGIT+;
RES_PARM : DIGIT LABEL;
VARIABLE : '$' LABEL;
fragment A:'A'|'a'; fragment B:'B'|'b'; fragment C:'C'|'c'; fragment D:'D'|'d';
fragment E:'E'|'e'; fragment F:'F'|'f'; fragment G:'G'|'g'; fragment H:'H'|'h';
fragment I:'I'|'i'; fragment J:'J'|'j'; fragment K:'K'|'k'; fragment L:'L'|'l';
fragment M:'M'|'m'; fragment N:'N'|'n'; fragment O:'O'|'o'; fragment P:'P'|'p';
fragment Q:'Q'|'q'; fragment R:'R'|'r'; fragment S:'S'|'s'; fragment T:'T'|'t';
fragment U:'U'|'u'; fragment V:'V'|'v'; fragment W:'W'|'w'; fragment X:'X'|'x';
fragment Y:'Y'|'y'; fragment Z:'Z'|'z';
fragment HEXDIGIT : DIGIT |'a..f'|'A'..'F';
fragment DIGIT : '0'..'9';
fragment LETTER : A | B | C | D | E | F | G | H | I | J | K | L | M
| N | O | P | Q | R | S | T | U | V | W | X | Y | Z
;
if $variable1 = 0 then
if $variable2 > 250 then
$variable3 := 0
else
$variable3 := 42
endif
endif
if (variable1 == 0)
{
if (variable2 > 250)
{
variable3 = 0;
}
else
{
variable3 = 42;
}
}
关于ANTLR语法if语句,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9314034/
让我们考虑以下 ANTLR4 语法(最小示例): grammar Foo; expr : a? b? c? ; 我如何指定 a、b 或 c 中的至少一个 必须出现在表达式? 基本上我正在寻
我为字符串变量声明写了下面的语法。字符串的定义类似于单引号之间的任何内容,但必须有一种方法可以通过使用 $ 字母转义将单引号添加到字符串值。 grammar test; options {
我最近创建了一个 ANTLR3 解析器规则 options : foo bar; 它没有编译,我花了一些时间才发现 options是一个保留字(AntlrWorks 指出了错误,但没有指出原因)。 A
我正在从“The Definitive Antlr reference”一书中学习 Antlr。我还处于起步阶段。我喜欢动手做东西,所以我认为做一个好的示例项目会是一个很好的学习经验。 我正在寻找一个
我们有一个为 antlr V2 编写的语法,我想迁移到 antlr v4。有迁移指南吗?我还想知道对现有 V2 语法的修改,以便我们更好地利用 v4 功能。 最佳答案 我通过编写一个新的 Antlr
介绍 查看文档,ANTLR 2 曾经有一个叫做 predicated lexing 的东西。 ,有这样的例子(受 Pascal 启发): RANGE_OR_INT : ( INT ".."
我已经开始学习 ANTLR,并且拥有 2007 年的书《The Definitive ANTLR Reference》和 ANTLRWorks(用于创建语法的交互式工具)。而且,作为这样的人,我从第三
我正在开发 D 语言的解析器,当我尝试添加“切片”运算符规则时遇到了麻烦。你可以找到它的ANTLR语法here 。基本上问题是,如果词法分析器遇到这样的字符串:“1..2”,它就会完全丢失,并且最终成
在 ANTLR 语法中,我们如何区分变量名和标识符? VAR: ('A'..'Z')+ DIGIT* ; IDENT : ('a'..'z'|'A'..'Z'|'_') ('a'..'z'|'
我想在 ANTLR 语法中解析 ISO 8601 日期。 2001-05-03 我的语法文件中有以下条目: date : FOUR_DIGIT ('-')? TWO_DIGIT ('-')? T
我们有一个为 antlr V3 编写的语法,我想迁移到 antlr v4。有没有迁移指南。我还想知道对现有 V3 语法的修改,以便我们很好地利用 v4 的功能。 最佳答案 如果您在 v3 或更早版本中
我正在尝试在一台新计算机上使用 ANTLR v4 语法插件在 IntelliJ 中运行一个简单的语法文件。我已经按照在线步骤在 IntelliJ 中安装插件,插件看起来安装正确。我在 .g4 语法文件
我正在使用 ANTLR 为旧的专有报告规范编写一个解析器,目前我正在尝试实现生成的解析树的访问者,以扩展自动生成的抽象访问类。 我对 ANTLR(我最近才学会)和一般的访问者模式都没有什么经验,但是如
我知道插入符号后缀在 antlr 中的含义(即 make root)但是当插入符号是我一直在阅读的以下语法中的前缀时呢(该语法是全新的,由学习 antlr 的新团队完成)。 .. selectClau
我不知道这个问题是否有效,因为我对源代码解析不是很熟悉。我的目标是为一种现有的编程语言(语言“X”)编写一个源代码完成函数,以供学习之用。 Antlr(v4) 是否适合这样的任务,还是应该手动完成必要
请查看源代码:https://gist.github.com/1684022 . 我定义了两个 token : ID : ('a'..'z' | 'A'..'Z') ('0'..'9' | 'a
我知道“+”、“?”和 '*'。但是,如果我希望某事重复 5 次,该怎么办?例如,如果标识符必须是长度为 5 的十六进制数字符串? 更具体地说,我正在考虑定义一个无限长度的通用词法分析器规则,然后在解
如何控制切换Antlr来自解析器操作的词法分析器模式? 我扩展了生成的 Parser 和 Lexer,所以我可以调用 pushMode和 popMode从解析器女巫依次调用合适的pushMode和 p
我正在使用 ANTLR 来标记一个简单的语法,并且需要区分一个 ID: ID : LETTER (LETTER | DIGIT)* ; fragment DIGIT : '
我有一个这样的 ANTLR 规则 receive returns[Evaluator e,String message] : RECEIVE FILENAME {$e= new ReceiveEv
我是一名优秀的程序员,十分优秀!