gpt4 book ai didi

从Linux读取EXE版本的C库?

转载 作者:IT王子 更新时间:2023-10-29 00:02:55 27 4
gpt4 key购买 nike

是否有我可以在 Linux 中使用的库,该库将返回资源管理器的版本选项卡中列出的 Windows EXE 文件的属性?这些是产品名称、产品版本、描述等字段。

对于我的项目,EXE 文件只能从内存中读取,不能从文件中读取。我想避免将 EXE 文件写入磁盘。

最佳答案

该文件的版本在 VS_FIXEDFILEINFO struct,但你必须在可执行数据中找到它。有两种方法可以做你想做的事:

  • 在文件中搜索 VERSION_INFO 签名并阅读 VS_FIXEDFILEINFO直接构造。
  • 找到 .rsrc部分,解析资源树,找到RT_VERSION资源,解析它并提取 VS_FIXEDFILEINFO数据。

  • 第一个更容易,但容易在错误的地方偶然找到签名。此外,您要求的其他数据(产品名称、描述等)不在此结构中,因此我将尝试解释如何以艰难的方式获取数据。

    PE 格式有点复杂,所以我将一段一段地粘贴代码,并带有注释和最少的错误检查。我将编写一个简单的函数,将数据转储到标准输出。将其编写为适当的函数作为练习留给读者:)

    请注意,我将在缓冲区中使用偏移量而不是直接映射结构,以避免与结构字段的对齐或填充相关的可移植性问题。无论如何,我已经注释了所用结构的类型(有关详细信息,请参阅包含文件 winnt.h)。

    首先是一些有用的声明,它们应该是不言自明的:
    typedef uint32_t DWORD;
    typedef uint16_t WORD;
    typedef uint8_t BYTE;

    #define READ_BYTE(p) (((unsigned char*)(p))[0])
    #define READ_WORD(p) ((((unsigned char*)(p))[0]) | ((((unsigned char*)(p))[1]) << 8))
    #define READ_DWORD(p) ((((unsigned char*)(p))[0]) | ((((unsigned char*)(p))[1]) << 8) | \
    ((((unsigned char*)(p))[2]) << 16) | ((((unsigned char*)(p))[3]) << 24))

    #define PAD(x) (((x) + 3) & 0xFFFFFFFC)

    然后是在可执行镜像中查找版本资源的函数(无大小检查)。
    const char *FindVersion(const char *buf)
    {

    EXE 中的第一个结构是 MZ header (为了与 MS-DOS 兼容)。
        //buf is a IMAGE_DOS_HEADER
    if (READ_WORD(buf) != 0x5A4D) //MZ signature
    return NULL;

    MZ 头中唯一有趣的字段是 PE 头的偏移量。 PE header 是真实的。
        //pe is a IMAGE_NT_HEADERS32
    const char *pe = buf + READ_DWORD(buf + 0x3C);
    if (READ_WORD(pe) != 0x4550) //PE signature
    return NULL;

    实际上,PE 头很无聊,我们想要 COFF 头,它包含所有符号数据。
        //coff is a IMAGE_FILE_HEADER
    const char *coff = pe + 4;

    我们只需要这个字段中的以下字段。
        WORD numSections = READ_WORD(coff + 2);
    WORD optHeaderSize = READ_WORD(coff + 16);
    if (numSections == 0 || optHeaderSize == 0)
    return NULL;

    可选头在 EXE 中实际上是强制性的,它就在 COFF 之后。 32 位和 64 位 Windows 的魔力是不同的。我假设从这里开始是 32 位。
        //optHeader is a IMAGE_OPTIONAL_HEADER32
    const char *optHeader = coff + 20;
    if (READ_WORD(optHeader) != 0x10b) //Optional header magic (32 bits)
    return NULL;

    有趣的部分来了:我们想找到资源部分。它有两部分:1.节数据,2.节元数据。

    数据位置位于可选标题末尾的表中,每个部分在该表中都有一个众所周知的索引。资源部分在索引 2 中,因此我们通过以下方式获取资源部分的虚拟地址 (VA):
        //dataDir is an array of IMAGE_DATA_DIRECTORY
    const char *dataDir = optHeader + 96;
    DWORD vaRes = READ_DWORD(dataDir + 8*2);

    //secTable is an array of IMAGE_SECTION_HEADER
    const char *secTable = optHeader + optHeaderSize;

    要获取节元数据,我们需要迭代节表以查找名为 .rsrc 的节。 .
        int i;
    for (i = 0; i < numSections; ++i)
    {
    //sec is a IMAGE_SECTION_HEADER*
    const char *sec = secTable + 40*i;
    char secName[9];
    memcpy(secName, sec, 8);
    secName[8] = 0;

    if (strcmp(secName, ".rsrc") != 0)
    continue;

    section 结构体有两个相关成员:该部分的 VA 和该部分在文件中的偏移量(也是该部分的大小,但我没有检查它!):
            DWORD vaSec = READ_DWORD(sec + 12);
    const char *raw = buf + READ_DWORD(sec + 20);

    现在文件中对应于 vaRes 的偏移量我们之前得到的 VA 很容易。
            const char *resSec = raw + (vaRes - vaSec);

    这是一个指向资源数据的指针。所有单个资源都以树的形式设置,分为3个层次:1)资源类型,2)资源标识符,3)资源语言。对于版本,我们将获得第一个正确类型的版本。

    首先,我们有一个资源目录(对于资源的类型),我们获取目录中的条目数,包括命名和未命名并迭代:
            WORD numNamed = READ_WORD(resSec + 12);
    WORD numId = READ_WORD(resSec + 14);

    int j;
    for (j = 0; j < numNamed + numId; ++j)
    {

    对于每个资源条目,我们获取资源的类型,如果它不是 RT_VERSION 常量 (16),则将其丢弃。
                //resSec is a IMAGE_RESOURCE_DIRECTORY followed by an array
    // of IMAGE_RESOURCE_DIRECTORY_ENTRY
    const char *res = resSec + 16 + 8 * j;
    DWORD name = READ_DWORD(res);
    if (name != 16) //RT_VERSION
    continue;

    如果它是 RT_VERSION,我们将进入树中的下一个资源目录:
                DWORD offs = READ_DWORD(res + 4);
    if ((offs & 0x80000000) == 0) //is a dir resource?
    return NULL;
    //verDir is another IMAGE_RESOURCE_DIRECTORY and
    // IMAGE_RESOURCE_DIRECTORY_ENTRY array
    const char *verDir = resSec + (offs & 0x7FFFFFFF);

    继续到下一个目录级别,我们不关心 id。其中之一:
                numNamed = READ_WORD(verDir + 12);
    numId = READ_WORD(verDir + 14);
    if (numNamed == 0 && numId == 0)
    return NULL;
    res = verDir + 16;
    offs = READ_DWORD(res + 4);
    if ((offs & 0x80000000) == 0) //is a dir resource?
    return NULL;

    第三级有资源的语言。我们也不在乎,所以只需捕获第一个:
                //and yet another IMAGE_RESOURCE_DIRECTORY, etc.
    verDir = resSec + (offs & 0x7FFFFFFF);
    numNamed = READ_WORD(verDir + 12);
    numId = READ_WORD(verDir + 14);
    if (numNamed == 0 && numId == 0)
    return NULL;
    res = verDir + 16;
    offs = READ_DWORD(res + 4);
    if ((offs & 0x80000000) != 0) //is a dir resource?
    return NULL;
    verDir = resSec + offs;

    我们得到了真正的资源,嗯,实际上是一个包含真实资源的位置和大小的结构,但我们不关心大小。
                DWORD verVa = READ_DWORD(verDir);

    那是版本资源的 VA,很容易转换成指针。
                const char *verPtr = raw + (verVa - vaSec);
    return verPtr;

    并做了!如果没有找到返回 NULL .
            }
    return NULL;
    }
    return NULL;
    }

    现在找到了版本资源,我们必须解析它。它实际上是“名称”/“值”对的树(还有什么)。有些值是众所周知的,这就是您要寻找的值,只需进行一些测试,您就会发现哪些值。

    注意 :所有字符串都存储在 UNICODE (UTF-16) 中,但我的示例代码将愚蠢的转换为 ASCII。此外,不检查溢出。

    该函数获取指向版本资源的指针和该内存中的偏移量(对于初学者为 0),并返回分析的字节数。
    int PrintVersion(const char *version, int offs)
    {

    首先,偏移量必须是 4 的倍数。
        offs = PAD(offs);

    然后我们得到版本树节点的属性。
        WORD len    = READ_WORD(version + offs);
    offs += 2;
    WORD valLen = READ_WORD(version + offs);
    offs += 2;
    WORD type = READ_WORD(version + offs);
    offs += 2;

    节点的名称是一个以 Unicode 零结尾的字符串。
        char info[200];
    int i;
    for (i=0; i < 200; ++i)
    {
    WORD c = READ_WORD(version + offs);
    offs += 2;

    info[i] = c;
    if (!c)
    break;
    }

    更多填充,如果需要:
        offs = PAD(offs);

    type不为0,则为字符串版本数据。
        if (type != 0) //TEXT
    {
    char value[200];
    for (i=0; i < valLen; ++i)
    {
    WORD c = READ_WORD(version + offs);
    offs += 2;
    value[i] = c;
    }
    value[i] = 0;
    printf("info <%s>: <%s>\n", info, value);
    }

    否则,如果名称是 VS_VERSION_INFO那么它是一个 VS_FIXEDFILEINFO结构。否则它是二进制数据。
        else
    {
    if (strcmp(info, "VS_VERSION_INFO") == 0)
    {

    我只是打印文件和产品的版本,但您可以轻松找到此结构的其他字段。当心混合字节序。
                //fixed is a VS_FIXEDFILEINFO
    const char *fixed = version + offs;
    WORD fileA = READ_WORD(fixed + 10);
    WORD fileB = READ_WORD(fixed + 8);
    WORD fileC = READ_WORD(fixed + 14);
    WORD fileD = READ_WORD(fixed + 12);
    WORD prodA = READ_WORD(fixed + 18);
    WORD prodB = READ_WORD(fixed + 16);
    WORD prodC = READ_WORD(fixed + 22);
    WORD prodD = READ_WORD(fixed + 20);
    printf("\tFile: %d.%d.%d.%d\n", fileA, fileB, fileC, fileD);
    printf("\tProd: %d.%d.%d.%d\n", prodA, prodB, prodC, prodD);
    }
    offs += valLen;
    }

    现在进行递归调用以打印完整的树。
        while (offs < len)
    offs = PrintVersion(version, offs);

    在返回之前还有一些填充。
        return PAD(offs);
    }

    最后,作为奖励, main功能。
    int main(int argc, char **argv)
    {
    struct stat st;
    if (stat(argv[1], &st) < 0)
    {
    perror(argv[1]);
    return 1;
    }

    char *buf = malloc(st.st_size);

    FILE *f = fopen(argv[1], "r");
    if (!f)
    {
    perror(argv[1]);
    return 2;
    }

    fread(buf, 1, st.st_size, f);
    fclose(f);

    const char *version = FindVersion(buf);
    if (!version)
    printf("No version\n");
    else
    PrintVersion(version, 0);
    return 0;
    }

    我已经用一些随机的 EXE 对其进行了测试,它似乎工作得很好。

    关于从Linux读取EXE版本的C库?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12396665/

    27 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com