c - Lex Yacc 解析器卡在 EOF-6ren

c - Lex Yacc 解析器卡在 EOF

转载作者：太空宇宙更新时间：2023-11-04 04:30:23

几天来我一直被这个问题困扰，这个解析器也是如此。这个解析器的要点是解析 http 请求，它确实可以，但是当到达请求结束时，解析器进入无限循环。我已经找到从 lex 文件生成的 C 文件中的点，但不知道如何解决这个问题。

我尝试了其他类似问题中建议的以下方法，但没有成功。

bison-end-of-file

lex-flex-scanning-for-the-eof-character

这是我的 lex 文件:

#undef YYLMAX
#define YYLMAX  4096

#include "ssoyacc.h"

#define yylval  ssolval
extern YYSTYPE  yylval;

#ifdef FLEX_SCANNER
#define YY_INPUT(buf, result, max_size) { int cc = sso_read(); result = (cc == -1) ? YY_NULL : (buf[0] = cc, 1);}
#else /* NO FLEX */
#undef input
#define input()         sso_read()
#define unput(cc)         sso_unput(cc)
#define yyless(cc)         sso_yyless(cc)
#endif /* FLEX */

%}

%p 30000
%n 4000
%e 2000
%a 30000
%k 2500
%o 50000

nondigit                [_a-zA-Z]
alfanum                 [_a-zA-Z0-9]
digit                   [0-9]
nonzero_digit           [1-9]
octal_digit             [0-7]
hexadecimal_digit       [0-9a-fA-F]

%start HTTP QUERY ARG XML TAG CDAT FORM_PARAM FORM_VALUE

%%

<INITIAL,HTTP>[ ]   {
            return SP;
        }
<INITIAL,HTTP>\r\n      {
            return CRLF;
        }
<HTTP>HTTP\/{digit}\.{digit}    {
            return HTTP_VERSION;
        }
<HTTP>OPTIONS       {
            return OPTIONS;
        }
<HTTP>GET   {
            return GET;
        }
.
.
.
other tags
.
.
.
<FORM_PARAM>\=  {
            BEGIN(FORM_VALUE);
            return IS;
        }
<FORM_VALUE>\&  {
            BEGIN(FORM_PARAM);
            return AMPERSAND;
        }
<FORM_VALUE>[0-9a-zA-Z\%\+\.\/]*    {
            if (yyleng < MAX_ARG_LEN)
            {
                char cc[3];
                int ii;
                int jj = 0;
                for (ii=0;ii<yyleng;ii++)
                {
                    if (yytext[ii] != '%')
                    {
                        if (yytext[ii] == '+')
                        {
                            yylval.sval[jj++] = ' ';
                        }
                        else
                        {
                            yylval.sval[jj++] = yytext[ii];
                        }
                    }
                    else
                    {
                        strncpy(cc, yytext+ii+1, 2);
                        cc[2] = 0;
                        yylval.sval[jj++] = strtol(cc, NULL, 16);
                        ii+=2;
                    }
                }
                yylval.sval[jj] = 0;
                return STRING;
            }
            else
            {
                return ERROR;
            }
        }
%%
int ssowrap(void)
{
        return 1;
}

void start_http()
{
    init_content(); /* initialize content count */
    BEGIN(HTTP);
}

void start_urlencoded()
{
    BEGIN(FORM_PARAM);
}

void start_xml()
{
    BEGIN(XML);
}


int sso_yyless(int count)
{
    int i;
    if (count>yyleng)
    {
        return 0;
    }
    for (i=0;i<yyleng-count;i++)
    {
        unput(yytext[yyleng-1-i]);
        yytext[yyleng-1-i] = '\0';
    }
    return 0;
}

void allprint(wchar_t cc)
{
    if (isprint(cc))
    {
        fprintf(stdout, "'%c' 0x%x", cc, cc);
    }
    else
    {
        fprintf(stdout, "%x", cc);
    }
}

void sprint(wchar_t *pc)
{
    fprintf(stdout, "%s", pc);
}

执行陷入循环 while (/*CONSTCOND*/1 ) 并在 case YY_END_OF_BUFFER: 中继续进入两次，然后在 case 126 中进入一次: 在 ssolex.c 文件中。 case 126 中声明的行是 lex 文件中的行 %%。

/** The main scanner function which does all the work.
 */
YY_DECL
{
    yy_state_type yy_current_state;
    char *yy_cp, *yy_bp;
    int yy_act;

    if ( !(yy_init) )
        {
        (yy_init) = 1;

#ifdef YY_USER_INIT
        YY_USER_INIT;
#endif

        if ( ! (yy_start) )
            (yy_start) = 1; /* first start state */

        if ( ! ssoin )
            ssoin = stdin;

        if ( ! ssoout )
            ssoout = stdout;

        if ( ! YY_CURRENT_BUFFER ) {
            ssoensure_buffer_stack ();
            YY_CURRENT_BUFFER_LVALUE =
                sso_create_buffer(ssoin,YY_BUF_SIZE );
        }

        sso_load_buffer_state( );
        }

    {
#line 44 "ssolex.l"


#line 1265 "<stdout>"

    while ( /*CONSTCOND*/1 )        /* loops until end-of-file is reached */
        {
        yy_cp = (yy_c_buf_p);

        /* Support of ssotext. */
        *yy_cp = (yy_hold_char);

        /* yy_bp points to the position in yy_ch_buf of the start of
         * the current run.
         */
        yy_bp = yy_cp;

        yy_current_state = (yy_start);
        yy_current_state += YY_AT_BOL();
yy_match:
        do
            {
            YY_CHAR yy_c = yy_ec[YY_SC_TO_UI(*yy_cp)] ;
            if ( yy_accept[yy_current_state] )
                {
                (yy_last_accepting_state) = yy_current_state;
                (yy_last_accepting_cpos) = yy_cp;
                }
            while ( yy_chk[yy_base[yy_current_state] + yy_c] != yy_current_state )
                {
                yy_current_state = (int) yy_def[yy_current_state];
                if ( yy_current_state >= 802 )
                    yy_c = yy_meta[(unsigned int) yy_c];
                }
            yy_current_state = yy_nxt[yy_base[yy_current_state] + (unsigned int) yy_c];
            ++yy_cp;
            }
        while ( yy_base[yy_current_state] != 1067 );

yy_find_action:
        yy_act = yy_accept[yy_current_state];
        if ( yy_act == 0 )
            { /* have to back up */
            yy_cp = (yy_last_accepting_cpos);
            yy_current_state = (yy_last_accepting_state);
            yy_act = yy_accept[yy_current_state];
            }

        YY_DO_BEFORE_ACTION;

do_action:  /* This label is used only to access EOF actions. */

打印的最后一件事是 Reading a token: 它在 yacc C 文件中，所以我认为问题一定是 lex 中的 EOF 处理。

/* YYCHAR is either YYEMPTY or YYEOF or a valid lookahead symbol.  */
if (yychar == YYEMPTY)
{
  YYDPRINTF ((stderr, "Reading a token: "));
  yychar = yylex ();
  printf("TOKEN %c, %d\n", yychar, yychar);
}

最佳答案

作为rici提到 sso_read 函数没有返回 -1，而是返回 0。此外，EOF 从未达到，因为 tcp 套接字仍按应有的方式打开。感谢 rici 和 Jon Bollinger 帮助解决这个问题!

关于c - Lex Yacc 解析器卡在 EOF，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/37029051/

文章推荐： css - 平行对齐 4 个 div，其中一个 div 为空

文章推荐： python - Windows 10 上的最新蚊子未运行

文章推荐： html - 显示 : inline-block DIV pushed downward

文章推荐： linux - 录制直播流的服务器？

lex - lex 中无法识别的规则
我正在用 lex 编写一个程序，它给了我以下错误: scan.l:49:无法识别的规则第 49 行是:{number} {return(NUM);} 编辑: 但是，错误似乎与之前的行直接相关，{id
lex - Lex 中的操作可以访问各个正则表达式组吗？
Lex 中的操作可以访问各个正则表达式组吗？ (注意:我猜不是，因为组字符 - 括号 - 是根据 documentation 用于更改优先级的。但如果是这样，您是否推荐可以执行此操作的替代 C/C++
lex - 如何在给定输入文件的 lex 中搜索特定单词？
我对 lex 很陌生。我正在尝试开发一个解析器来搜索给定输入文件中特定单词的计数... 我的代码是 %{ #include #include #include int
lex - 使用 Lex/Yacc 识别汉字中的标识符
如何使用 Lex/Yacc 识别汉字中的标识符？最佳答案我想你的意思是 Lex(词法分析器生成器)。 Yacc 是解析器生成器。根据 What's the complete range for
lex - 如何为 lex 中不匹配的字符禁用 ECHO()
我需要为不匹配的字符禁用 flex 输出。默认情况下，我无法禁用 ECHO()，也无法禁用 yyout。任何变体？最佳答案 lex 的创建者提供了一种更简单、更易于维护的方法。在所有其他规则的末尾添
amazon-lex - 在 amazon Lex 中使用正则表达式制作自定义插槽
我想制作接受任何和所有条目的自定义插槽，只要这些条目遵循特定的正则表达式模式，例如:任意数量的字母或数字，但中间没有空格。谁能告诉我 amazon lex 中是否有实现它的方法？另外，如果我想获取某种
amazon-lex - 如何在 AWS Lex 中访问原始输入文本和整个对话
如何访问原始文本以引导 lex 中的意图如何提取整个对话，包括用户输入和 Lex 响应我想创建一个 lambda 和 API 网关来捕获输入并在将其发送到 Lex 之前记录它，并在每个意图 lam
amazon-lex - AWS Lex AlphaNumeric 内置插槽类型不接受字符串
我一直在研究具有多个意图的 AWS Lex 机器人。目前我遇到一个问题，插槽类型为 AMAZON.AlphaNumberic 的插槽只接受数字。当我输入诸如“测试”之类的词时，它不会继续进入下一个槽
amazon-lex - 在 Amazon Lex 中格式化字符串输出
我正在尝试使用 AWS Lambda 的 C# 版本在列表中打印一系列对象。它链接到我的 AWS RDS 和我的 Lex 机器人。目前，当我使用 LEX 测试控制台测试机器人时，即使我使用 C# 的\
c - Lex - 如何在命令行上运行/编译 lex 程序
我对 Lex 和 Yacc 很陌生。我有一个 Lex 程序。示例:wordcount.l 我正在使用 windows 和 putty。我只是想运行这个文件.. wordcount.l文件是否放在C盘
lex - lex.yy.c 中的 "yy"代表什么？
lex.yy.c 中的“yy”代表什么？最佳答案 Lex 旨在与 Yacc 配合使用。 Steven Johnson 的论文 Yacc: Yet Another Compiler Compiler
bison - Lex 和 Yacc 可以对自己进行 lex 和解析吗？
Lex 和 Yacc 可以同时对 Lex 和 Yacc 进行 lex 和解析吗？换句话说，是否可以编写一个自托管的 Lex/Yacc 组合，生成自己的解析器？编辑:我并不是说组合需要完全解析输入的
jison - jison 中的 %lex 和/lex 行是什么？
可以在以下位置找到以下代码片段:http://zaach.github.io/jison/demos/calc/ ，以及 jison 文档页面。阅读 jison、lex 和 flex 文档后 - 我仍
c++ - 如何在不先将整个文件读入内存的情况下使用 Boost::Spirit::Lex 对文件进行 lex？
我正在研究使用 boost::spirit::lex 编写词法分析器，但我能找到的所有示例似乎都假定您已先将整个文件读入 RAM。我想编写一个不需要整个字符串都在 RAM 中的词法分析器，这可能吗？或
amazon-lex - 如何通过 .NET SDK 构建 aws lex bot
我正在寻找通过 .NET SDK 或任何其他 API 构建和发布 AWS Lex 机器人的解决方案。我们将不胜感激。最佳答案我最近刚刚使用 .NET SDK 开发了一个可用的 Amazon Le
c++ - boost-sprit-lex 将多个标记统一为 lex 中由 id 区分的单个标记
编辑:我删除了词法分析器，因为它没有与 Qi 完全集成，只是混淆了语法(见下面的答案)。我的词法分析器如下所示: template struct tokens : lex::lexer { tok
compiler-construction - lex 使用来自 lex.yy.c 文件的 flex -gettin 输出
我为行数和字符数编写了一个 lex 程序(.l 文件) 程序: %{ int charcount=0,linecount=0; %} %% .charcount++ \n linecount++,
amazon-web-services - 亚马逊 Lex 错误 : An error occurred (BadRequestException) when calling the PutIntent operation: RelativeId does not match Lex ARN format
我正在尝试使用亚马逊的 boto3 构建一个聊天机器人图书馆。现在，我正在尝试使用 put_intent 创建一个意图。功能。我的代码如下: intent = lexClient.put_intent
lex:无法识别的字符串的默认规则
在 ocamllex 中，我可以使用 _作为词法规则匹配任何与先前定义的规则不匹配的字符串，并引发错误。如何在 lex/flex 中实现这一点？最佳答案通常，您会定义这样的规则，它会放在最后: .
lex - FlexSDK编译mxml文件
下载并安装了最新版本的 FlexSDK。将其解压到文件夹 C:FlexSDK 中。打开 C:/FlexSDK/bin 的命令提示符。运行该文件夹的目录，我的 mxmlc.exe 文件就在那里。在命令提

太空宇宙

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

c - Lex Yacc 解析器卡在 EOF