c++ - 使用c++的c/c++源文件的词法分析器-6ren

c++ - 使用c++的c/c++源文件的词法分析器

转载作者：行者123 更新时间：2023-11-28 08:02:57

我有适用于表达式的 c/c++ 词法分析器代码，如何将其用于 c/c++ 源文件。我试过像下面的代码..它产生了不正确的 token 集..

代码:

    #include<iostream.h>
#include<conio.h>
#include<string.h>
#include<ctype.h>
#include<stdio.h>
#include<fstream.h>
#include<stdlib.h>
class Lex_Ana
{
public :
    int i,j,k,ti,oprfl,delfl,keyfl,Litfl,cLitfl,ptfl,tfl,mxIdeni,Liti,mxIdenj,mxOpri,mxOprj,mxDeli,Erri;
    int uqIdi,uqOpi,uqDei,defOpi,defKeyi,cLiti;
    char mStr[50],mxIden[20][20],mxOpr[20][20],mxDel[20],tmpStr[50];
    char defOprStr[20][20],defOpr[15],defDel[15],defKey[20][20];
    char uqOpr[20][20],uqIden[20][20],uqIdfl[20],uqOpfl[20],uqDefl[20],uqDel[20];
    char Opr[20][20],invalTok[20][20],Con[20][20],Iden[20][20],
         Key[20][20],inTok[20],Lit[20][20],Err[20][20],cLit[20][20];
    int Opri,invToki,Coni,Ideni,Keyi,Deli,inToki;

    Lex_Ana(char *str)
    {
        strcpy(mStr,str);

        //Defined Keywords
        defKeyi=13;
        strcpy(defKey[0],"int");
        strcpy(defKey[1],"float");
        strcpy(defKey[2],"double");
        strcpy(defKey[3],"for");
        strcpy(defKey[4],"if");
        strcpy(defKey[5],"else");
        strcpy(defKey[6],"while");
        strcpy(defKey[7],"do");
        strcpy(defKey[8],"return");
        strcpy(defKey[9],"char");
        strcpy(defKey[10],"break");
        strcpy(defKey[11],"goto");
        strcpy(defKey[12],"void");

        //Defined Operators
        defOpi=18;
        strcpy(defOprStr[0],"+");
        strcpy(defOprStr[1],"-");
        strcpy(defOprStr[2],"*");
        strcpy(defOprStr[3],"/");
        strcpy(defOprStr[4],"%");
        strcpy(defOprStr[5],"=");
        strcpy(defOprStr[6],"<");
        strcpy(defOprStr[7],">");
        strcpy(defOprStr[8],"<=");
        strcpy(defOprStr[9],">=");
        strcpy(defOprStr[10],"==");
        strcpy(defOprStr[11],"=+");
        strcpy(defOprStr[12],"=-");
        strcpy(defOprStr[13],"=*");
        strcpy(defOprStr[14],"=/");
        strcpy(defOprStr[15],"=%");
        strcpy(defOprStr[16],"++");
        strcpy(defOprStr[17],"--");
        strcpy(defOpr,"+-/*%=<>");
        strcpy(defDel,";,:{}[]()");
    }

    int IsMxIden(char ch)
    {
        return((IsIden(ch)||IsFloat(ch))?1:0);
    }

    int IsIden(char ch)
    {
        return((isalpha(ch)||ch=='_')?1:0);
    }

    int IsFloat(char ch)
    {
        return((isdigit(ch)||ch=='.')?1:0);
    }

    int IsOpr(char ch)
    {
        oprfl=0;
        for(ti=0;ti<strlen(defOpr)&&!oprfl;ti++)
        {
        if(ch==defOpr[ti])
        {
            oprfl=1;
        }
        }
        return oprfl;
    }

    int IsDel(char ch)
    {
        delfl=0;
        for(ti=0;ti<strlen(defDel)&&!delfl;ti++)
        {
        if(ch==defDel[ti])
        {
            delfl=1;
        }
        }
        return delfl;
    }

    int IsKey(char *str)
    {
        keyfl=0;
        for(ti=0;ti<defKeyi&&!keyfl;ti++)
        {
        if(!strcmp(defKey[ti],str))
        {
            keyfl=1;
        }
        }
        return keyfl;
    }


    void Find_Lex()
    {
        i=0;
        cLiti=0;
        Liti=0;
        Erri=0;
        mxIdeni=0;
        mxIdenj=0;
        mxOpri=0;
        mxOprj=0;
        mxDeli=0;
        inToki=0;
        while(mStr[i]!='\0')
        {
        if(IsMxIden(mStr[i]))
        {
            while(IsMxIden(mStr[i]))
            {
            mxIden[mxIdeni][mxIdenj++]=mStr[i++];
            if(!IsMxIden(mStr[i]))
            {
                mxIden[mxIdeni++][mxIdenj]='\0';
                mxIdenj=0;
            }
            }
        }
        else if(mStr[i]=='"')
        {
            Litfl=1;
            k=0;
            tmpStr[k++]=mStr[i];
            for(j=i+1;j<strlen(mStr)&&Litfl;j++)
            {
                tmpStr[k++]=mStr[j];
                if(mStr[j]=='"')
                {
                    tmpStr[k]='\0';
                    strcpy(Lit[Liti++],tmpStr);
                    Litfl=0;
                    i=j+1;
                }
            }
            if(Litfl)
            {
                strcpy(Err[Erri++],"Invalid Use of \"");
                i++;
            }
        }
        else if(mStr[i]=='\'')
        {
            cLitfl=0;
            k=0;
            tmpStr[k++]=mStr[i];
            for(j=i+1;j<strlen(mStr)&&!cLitfl;j++)
            {
                tmpStr[k++]=mStr[j];
                if(mStr[j]=='\'')
                {
                    tmpStr[k]='\0';
                    if(strlen(tmpStr)!=3)
                    {
                        strcpy(Err[Erri++],"Invalid Use of \'");
                        cLitfl=1;
                        i++;
                    }
                    else
                    {
                        strcpy(cLit[cLiti++],tmpStr);
                        cLitfl=1;
                        i=j+1;
                    }
                }
            }
            if(!cLitfl)
            {
                strcpy(Err[Erri++],"Invalid Use of \'");
                cLitfl=1;
                i++;
            }
        }
        else if(IsOpr(mStr[i]))
        {
            while(IsOpr(mStr[i]))
            {
            mxOpr[mxOpri][mxOprj++]=mStr[i++];
            if(!IsOpr(mStr[i]))
            {
                mxOpr[mxOpri++][mxOprj]='\0';
                mxOprj=0;
            }
            }
        }
        else if(IsDel(mStr[i]))
        {
            while(IsDel(mStr[i]))
            {
            mxDel[mxDeli++]=mStr[i++];
            }
            mxDel[mxDeli]='\0';
        }
        else if(mStr[i]!=' ')
        {
            inTok[inToki++]=mStr[i++];
            inTok[inToki]='\0';
        }
        else
        {
            i++;
        }
        }
    }

    void Rem_Dup()
    {
        uqIdi=0;
        uqDei=0;
        uqOpi=0;
        for(i=0;i<20;i++)
        {
        uqOpfl[i]=0;
        uqIdfl[i]=0;
        uqDefl[i]=0;
        }
        for(i=1;i<mxIdeni+1;i++)
        {
        if(uqIdfl[i-1]==0)
        {
            strcpy(uqIden[uqIdi++],mxIden[i-1]);
            for(j=i;j<mxIdeni;j++)
            {
            if(!strcmp(mxIden[j],mxIden[i-1]))
            {
                uqIdfl[j]=1;
            }
            }
        }
        }
        for(i=1;i<mxOpri+1;i++)
        {
        if(uqOpfl[i-1]==0)
        {
            strcpy(uqOpr[uqOpi++],mxOpr[i-1]);
            for(j=i;j<mxOpri;j++)
            {
            if(!strcmp(mxOpr[j],mxOpr[i-1]))
            {
                uqOpfl[j]=1;
            }
            }
        }
        }
        for(i=1;i<mxDeli+1;i++)
        {
        if(uqDefl[i-1]==0)
        {
            uqDel[uqDei++]=mxDel[i-1];
            uqDel[uqDei]='\0';
            for(j=i;j<mxDeli;j++)
            {
            if(mxDel[j]==mxDel[i-1])
            {
                uqDefl[j]=1;
            }
            }
        }
        }
    }

    void Sep_Val()
    {
        Opri=0;
        invToki=0;
        Ideni=0;
        Coni=0;
        Keyi=0;
        for(i=0;i<uqIdi;i++)
        {
        if(IsIden(uqIden[i][0]))
        {
            if(IsKey(uqIden[i]))
            {
            strcpy(Key[Keyi++],uqIden[i]);
            }
            else
            {
            ptfl=1;
            for(j=0;j<strlen(uqIden[i])&&ptfl;j++)
            {
                if(uqIden[i][j]=='.')
                {
                    strcpy(invalTok[invToki++],uqIden[i]);
                    ptfl=0;
                }
            }
            if(ptfl)
            {
                strcpy(Iden[Ideni++],uqIden[i]);
            }
            }
        }
        else
        {
            tfl=1;
            ptfl=0;
            for(j=0;j<strlen(uqIden[i])&&tfl;j++)
            {
            if(IsIden(uqIden[i][j]))
            {
                strcpy(invalTok[invToki++],uqIden[i]);
                tfl=0;
            }
            else if(uqIden[i][j]=='.')
            {
                if(ptfl)
                {
                    strcpy(invalTok[invToki++],uqIden[i]);
                    tfl=0;
                }
                if(!ptfl)
                {
                    ptfl=1;
                }
            }
            }
            if(tfl)
            {
            strcpy(Con[Coni++],uqIden[i]);
            }
        }
        }
        for(i=0;i<uqOpi;i++)
        {
        tfl=1;
        for(j=0;j<defOpi&&tfl;j++)
        {
            if(!strcmp(uqOpr[i],defOprStr[j]))
            {
            strcpy(Opr[Opri++],uqOpr[i]);
            tfl=0;
            }
        }
        if(tfl)
        {
            strcpy(invalTok[invToki++],uqOpr[i]);
        }
        }
    }

    void Display()
    {
        printf("\n\n\t: Lexical Analysis Report :\n\t%c Input String: %s\n\n\n",272,mStr);
        printf("\t%c Total Identifiers: %d\n",272,Ideni);
        for(i=0;i<Ideni;i++)
        {
        printf("\t\t");
        puts(Iden[i]);
        }
        printf("\n\t%c Total Constants: %d\n",272,Coni);
        for(i=0;i<Coni;i++)
        {
        printf("\t\t");
        puts(Con[i]);
        }
        printf("\n\t%c Total Literals: %d\n",272,Liti+cLiti);
        for(i=0;i<Liti;i++)
        {
        printf("\t\t");
        puts(Lit[i]);
        }
        for(i=0;i<cLiti;i++)
        {
        printf("\t\t");
        puts(cLit[i]);
        }
        printf("\n\t%c Total Keywords: %d\n",272,Keyi);
        for(i=0;i<Keyi;i++)
        {
        printf("\t\t");
        puts(Key[i]);
        }
        printf("\n\t%c Total Operators: %d\n",272,Opri);
        for(i=0;i<Opri;i++)
        {
        printf("\t\t");
        puts(Opr[i]);
        }
        printf("\n\t%c Total Delimeters: %d\n",272,uqDei);
        if(uqDei)
        {
        printf("\t\t");
        puts(uqDel);
        }
        printf("\n\t%c Total Invalid Tokens: %d\n",272,invToki+inToki);
        for(i=0;i<invToki;i++)
        {
        printf("\t\t");
        puts(invalTok[i]);
        }
        if(inToki)
        {
        for(i=0;i<strlen(inTok);i++)
        {
            printf("\t\t");
            printf("%c\n",inTok[i]);
        }
        }
        printf("\n\t%c Invalid Used Tokens: %d\n",272,Erri);
        for(i=0;i<Erri;i++)
        {
        printf("\t\t");
        puts(Err[i]);
        }
    }

};

void main()
{
clrscr();
FILE *fp;
    int size=0;
char file_name[40],ch;
char mystring[200];
printf("\n\n\tEnter File name: ");
gets(file_name);
fp=fopen(file_name,"r");
if(fp==NULL)
{
 perror("Error while opening the file.\n");
 exit(EXIT_FAILURE);
}
else
{
      fseek(fp, 0, SEEK_END);
  size = ftell(fp);
  fseek(fp, 0, SEEK_SET);
 while(( ch = fgetc(fp)) != EOF)
 {
   //printf("%c",ch);
   if(fgets (mystring , size , fp) != NULL )
   {
     //puts(mystring);//Here prints full file
     Lex_Ana oblex(mystring);//But here the last line going for lexical analysis
     oblex.Find_Lex();
     oblex.Rem_Dup();
     oblex.Sep_Val();
     oblex.Display();
     break;
   }
 }
}
fclose(fp);
getch();
}

谁能解决这个...
编译器:Turbo c 3。

最佳答案

while(indata.eof())

应该是

while(!indata.eof())

更好地使用

while(indata.getline(ch,800))

还有，在

{
 while(indata.eof())
 {
    indata>>ch;
 }
}
Lex_Ana oblex(ch);
    oblex.Find_Lex();
    oblex.Rem_Dup();
    oblex.Sep_Val();
    oblex.Display();

为什么要重写到 ch 直到 eof？如果这样做，分析器只会分析文件的最后一个词。

我想你想要这样的东西

while(indata.getline(ch,800))
{
    Lex_Ana oblex(ch);
    oblex.Find_Lex();
    oblex.Rem_Dup();
    oblex.Sep_Val();
    oblex.Display();
}

关于c++ - 使用c++的c/c++源文件的词法分析器，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/10912615/

文章推荐： javascript - Angular-Route 和 ng-view div 隐藏页面

文章推荐： iOS .stringsdict 不工作

文章推荐： javascript - 容器上的单击事件？

文章推荐： Swift 特权助手(XPC 监听器)因非法指令错误而崩溃

javascript - 使用 WebScriptEndpoint 使用 javascript 使用 WCF 服务
我在网上搜索但没有找到任何合适的文章解释如何使用 javascript 使用 WCF 服务，尤其是 WebScriptEndpoint。任何人都可以对此给出任何指导吗？谢谢最佳答案这是一篇关于
c - 没有结果!!使用 fork() 使用 dup2 使用 2 个管道运行 execlp()
我正在编写一个将运行 Linux 命令的 C 程序，例如: cat/etc/passwd | grep 列表 |剪切-c 1-5 我没有任何结果 *这里 parent 等待第一个 child (chi
python - 处理文件上传，使用 Pillow 调整大小，使用 SQLAlchemy 存储，使用 Flask 提供文件
所以我正在尝试处理文件上传，然后将该文件作为二进制文件存储到数据库中。在我存储它之后，我尝试在给定的 URL 上提供文件。我似乎找不到适合这里的方法。我需要使用数据库，因为我使用 Google 应用引
excel - 使用 IF 使用 VBA 在单元格中添加公式的问题
我正在尝试制作一个宏，将下面的公式添加到单元格中，然后将其拖到整个列中并在 H 列中复制相同的公式我想在 F 和 H 列中输入公式的数据 Range("F1").formula = "=IF(ISE
使用 OperatorPrecedenceParser 使用 FParsec 解析函数应用程序？
问题类似于this one ，但我想使用 OperatorPrecedenceParser 解析带有函数应用程序的表达式在 FParsec . 这是我的 AST: type Expression =
sql - 使用 sequelize 使用 where 查询编码计数
我想通过使用 sequelize 和 node.js 将这个查询更改为代码取决于在哪里 select COUNT(gender) as genderCount from customers where
bash - 使用 “let”分配Bash失败，使用 “/”
我正在使用GNU bash，版本5.0.3(1)-发行版(x86_64-pc-linux-gnu)，我想知道为什么简单的赋值语句会出现语法错误: #/bin/bash var1=/tmp
javascript - 使用 JavaScript 使用 FOR OF 数组循环时出现错误？
这里，为什么我的代码在 IE 中不起作用。我的代码适用于所有浏览器。没有问题。但是当我在 IE 上运行我的项目时，它发现错误。而且我的 jquery 类和 insertadjacentHTMl 也不
javascript - 使用 javascript 使用 for 属性更改表单标签内容
我正在尝试更改标签的innerHTML。我无权访问该表单，因此无法编辑 HTML。标签具有的唯一标识符是“for”属性。这是输入和标签的结构:
javascript - 使用 jquery 使用 .on() 将事件附加到页面上的动态插入按钮
我有一个页面，我可以在其中返回用户帖子，可以使用一些 jquery 代码对这些帖子进行即时评论，在发布新评论后，我在帖子下插入新评论以及删除按钮。问题是 Delete 按钮在新插入的元素上不起作用，
使用 awk 使用 sha1sum 进行散列
我有一个大约有 20 列的“管道分隔”文件。我只想使用 sha1sum 散列第一列，它是一个数字，如帐号，并按原样返回其余列。使用 awk 或 sed 执行此操作的最佳方法是什么？ Accounti
mysql - 使用 insert into 使用 mysql
我需要将以下内容插入到我的表中...我的用户表有五列 id、用户名、密码、名称、条目。 (我还没有提交任何东西到条目中，我稍后会使用 php 来做)但由于某种原因我不断收到这个错误:#1054 - U
jquery - 将输入字段值修剪为仅字母数字字符/使用 .使用 jQuery
所以我试图有一个输入字段，我可以在其中输入任何字符，但然后将输入的值小写，删除任何非字母数字字符，留下“。”而不是空格。例如，如果我输入: 地球的 70% 是水，-!*#$^^ & 30% 土地输
javascript - 使用 .innerHTML 使用 DOM
我正在尝试做一些我认为非常简单的事情，但出于某种原因我没有得到想要的结果？我是 javascript 的新手，但对 java 有经验，所以我相信我没有使用某种正确的规则。这是一个获取输入值、检查选择
php - 使用 angularjs 使用 where 子句从数据库获取数据
我想使用 angularjs 从 mysql 数据库加载数据。这就是应用程序的工作原理；用户登录，他们的用户名存储在 cookie 中。该用户名显示在主页上我想获取这个值并通过 angularjs
ios - 使用 UITableViewCell 使用 AutoLayout
我正在使用 autoLayout，我想在 UITableViewCell 上放置一个 UIlabel，它应该始终位于单元格的右侧和右侧的中心。这就是我想要实现的目标所以在这里你可以看到我正在谈论的
mysql - 使用 ElasticSearch 使用 or 和运算符搜索多个字段
我需要与 MySql 等效的 elasticsearch 查询。我的 sql 查询: SELECT DISTINCT t.product_id AS id FROM tbl_sup_price t
ios - 使用 Swift 使用 JSON
我正在实现代码以使用 JSON。 func setup() { if let flickrURL = NSURL(string: "https://api.flickr.com/
javascript - 使用 JavaScript 使用 for 循环声明变量
我尝试使用for循环声明变量，然后测试cols和rols是否相同。如果是，它将运行递归函数。但是，我在 javascript 中执行 do 时遇到问题。有人可以帮忙吗？现在，在比较 col.1 和
jquery - 使用 :after 使用 jquery 更改样式
我举了一个我正在处理的问题的简短示例。 HTML代码: 1 2 3 CSS 代码: .BB a:hover{ color: #000; } .BB > li:after {

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

c++ - 使用c++的c/c++源文件的词法分析器