gpt4 book ai didi

c - C 中的类型双关和 union

转载 作者:太空狗 更新时间:2023-10-29 16:40:32 29 4
gpt4 key购买 nike

我目前正在开发一个小型编译器的项目。

我决定采用构建一个极其简单的虚拟机作为目标的方法,这样我就不必担心学习 elf、intel 汇编等的来龙去脉。

我的问题是关于 C 中使用 union 的类型双关语。我决定在虚拟机内存中只支持 32 位整数和 32 位浮点值。为了方便这一点,虚拟机的“主内存”是这样设置的:

typedef union
{
int i;
float f;
}word;


memory = (word *)malloc(mem_size * sizeof(word));

因此我可以根据指令将内存部分视为 int 或 float。

这是技术上的双关语吗?如果我使用 int 作为内存词,然后使用 float* 将它们当作 float ,那肯定会是这样。我目前的方法虽然在句法上有所不同,但我认为在语义上没有什么不同。最后,我仍然将内存中的 32 位视为 int 或 float。

我能在网上找到的唯一信息表明这是依赖于实现的。有没有更便携的方式来实现这一目标而不浪费大量空间?

我可以执行以下操作,但那样我将占用 2 倍多的内存并在 union 方面“重新发明轮子”。

typedef struct
{
int i;
float f;
char is_int;
}

编辑

我可能没有说清楚我的确切问题。我知道我可以在没有未定义行为的情况下使用 union 中的 float 或 int。我所追求的是一种拥有 32 位内存位置的方法,我可以在不知道最后一个值集是什么的情况下安全地将其用作 int 或 float。我想说明使用其他类型的情况。

最佳答案

是的,存储 union 的一个成员并读取另一个是类型双关(假设类型足够不同)。而且,这是C语言官方支持的唯一一种通用(任意类型对任意类型)类型双关。它在某种意义上得到支持,即语言 promise 在这种情况下类型双关将实际发生,即将发生将一种类型的对象读取为另一种类型的对象的物理尝试。除其他外,这意味着写入 union 的一个成员并读取另一个成员意味着写入和读取之间存在数据依赖性。然而,这仍然让您承担确保类型双关不会产生陷阱表示的负担。

当您使用强制转换指针进行类型双关(通常被理解为“经典”类型双关)时,该语言明确指出在一般情况下行为是未定义的(除了将对象的值重新解释为 char 数组 和其他限制情况)。像 GCC 这样的编译器实现了所谓的“严格别名语义”,这基本上意味着基于指针的类型双关可能无法像您期望的那样工作。例如,编译器可能(并且将会)忽略类型双关读写之间的数据依赖性并任意重新排列它们,从而完全破坏您的意图。这个

int i;
float f;

i = 5;
f = *(float *) &i;

可以很容易地重新排列成实际的

f = *(float *) &i;
i = 5;

特别是因为严格别名编译器故意忽略示例中写入和读取之间数据依赖的可能性。

在现代 C 编译器中,当您确实需要将一个对象值物理重新解释为另一种类型的值时,您只能使用 memcpy-ing 字节从一个对象到另一个对象或基于 union 的类型双关语。没有其他办法。类型转换指针不再是一个可行的选择。

关于c - C 中的类型双关和 union ,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11442708/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com