gpt4 book ai didi

java - 解析C源文件

转载 作者:太空宇宙 更新时间:2023-11-04 01:37:41 24 4
gpt4 key购买 nike

如果我有一个 C 源文件并且我想在一个函数中定位一个特定的局部变量并使其成为全局变量 - 这样另一个工具就能够处理 C 文件(我没有编写的工具)会是什么最简单的方法来做到这一点?我正在考虑使用正则表达式,但即使这样也有它自己的问题。这有点像用 Java 编写一个迷你 C 解析器。很多工作:S

是否有任何库可以帮助简化此过程?

例如,假设我想将变量“i”变成一个全局变量。用户将指定函数名称和变量名称(但不是变量的类型 - 即“int”)。

我可以使用正则表达式来查找函数 - 当然可以。但是从那里我真的不知道最好的方法是什么?...CDT 插件会有帮助吗?

示例:

 /* 
* add.c
* a simple C program
*
*/

#include <stdio.h>
#define LAST 10

int main()
{
int i = 0;
int sum = 0;

for ( i = 1; i <= LAST; i++ ) {
sum += i;
} /*-for-*/
printf("sum = %d\n", sum);

return 0;
}

转换为:

 /* 
* add.c
* a simple C program
*
*/

#include <stdio.h>
#define LAST 10

int i = 0;

int main()
{

int sum = 0;

for ( i = 1; i <= LAST; i++ ) {
sum += i;
} /*-for-*/
printf("sum = %d\n", sum);

return 0;
}

最佳答案

如果你只做简单的例子,你可以用 Perl 或一些 java regex 来解决这个问题。它不会在复杂的程序上可靠地工作,因为你需要一个真正的解析器。

我们的 DMS Software Reengineering Toolkit及其 C Front End可以非常可靠地用于此。

DMS 提供通用程序分析和转换功能,由编程语言描述参数化。 DMS 的 C Front 向 DMS 解释了 C 的精确语法是什么(针对 C 的各种方言,包括 GCC 和 MS);它实际上提供了一个完整的解析器,生成抽象语法树(以及相反:来自 AST 的 C 代码生成器)这允许 DMS 准确读取 C 源文件,包括预处理。

使用 AST 形式的解析代码,您可以构建 DMS 函数和/或编写模式来查找函数定义,尤其是您的目标变量。然后可以使用 DMS 代码或交替的源到源转换将变量从函数中提取出来,和/或插入代码以跟踪该变量的状态变化,以便可以看到它。

因此,使用 DMS 和一些自定义代码,您可以达到您想要的效果。您提供的示例使用 DMS 可能非常简单,但学习曲线仍然很长; DMS 很复杂,因为它处理的语言很复杂,您必须学习如何使用它。因此,这不是适合新手的下午练习。

注意:您需要对预处理程序执行此操作(否则您通常无法可靠地解析它们)。所以,这应该是你在编译之前做的事情,不应该成为最终代码的一部分。

如果您想对代码进行永久更改,则需要解析未预处理 代码;这太难了。 DMS 的 C 前端可以在预处理器指令“结构化”的范围内做到这一点;其中大约 95% 是。所以现在您遇到了一个新问题:要么修复非结构化文件(一次性手动更改),要么拒绝“运气不好”无法解析的文件。

您可能会使用 GCC 而不是 DMS;毕竟它有一个经过良好测试的 C 解析器。不过,它不会帮助您生成修改后的 C 代码。另一个替代方案是 Clang,它作为一个非常好的替代方案正在迅速出现。我认为它会解析 C++;不太确定 C,尤其是您的最终用户可能使用的 C 方言(您没有说)。它具有像 DMS 这样的 AST,以及一种为可能有效的代码生成“补丁”的方案。

关于java - 解析C源文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11585279/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com