gpt4 book ai didi

c - 读取不确定值会调用 UB?

转载 作者:行者123 更新时间:2023-12-02 08:20:26 26 4
gpt4 key购买 nike

SO 上各种受人尊敬的高代表用户一直坚持认为读取具有不确定值的变量“总是 UB”。那么C标准中到底在哪里提到了这一点呢?

很明显,不确定值可能是未指定的值,也可能是陷阱表示:

3.19.2
indeterminate value
either an unspecified value or a trap representation

3.19.3
unspecified value
valid value of the relevant type where this International Standard imposes no requirements on which value is chosen in any instance
NOTE An unspecified value cannot be a trap representation.

3.19.4
trap representation
an object representation that need not represent a value of the object type

同样清楚的是,读取陷阱表示会调用未定义的行为,6.2.6.1:

Certain object representations need not represent a value of the object type. If the stored value of an object has such a representation and is read by an lvalue expression that does not have character type, the behavior is undefined. If such a representation is produced by a side effect that modifies all or any part of the object by an lvalue expression that does not have character type, the behavior is undefined.50) Such a representation is called a trap representation.

但是,不确定值不一定包含陷阱表示。事实上,对于使用补码的系统,陷阱表示非常罕见。

C 标准中的哪个地方实际上说读取不确定值会调用未定义的行为?

我正在阅读C11的非规范性附录J,发现这确实被列为UB的一种情况:

The value of an object with automatic storage duration is used while it is indeterminate (6.2.4, 6.7.9, 6.8).

但是,列出的部分是无关紧要的。 6.2.4 仅说明有关生命周期以及变量值何时变得不确定的规则。同样,6.7.9 涉及初始化并说明变量的值如何变得不确定。 6.8 似乎几乎无关紧要。这些部分均不包含任何规范性文本说明访问不确定值可能导致 UB。这是附录 J 中的缺陷吗?

然而,6.3.2.1 中有一些关于左值的相关规范文本:

If the lvalue designates an object of automatic storage duration that could have been declared with the register storage class (never had its address taken), and that object is uninitialized (not declared with an initializer and no assignment to it has been performed prior to use), the behavior is undefined.

但这是一种特殊情况,它仅适用于具有自动存储持续时间但其地址从未被占用的变量。我一直认为 6.3.2.1 的这一部分是 UB 关于不确定值(不是陷阱表示)的唯一情况。但人们一直坚称“它永远是UB”。那么这具体是在哪里提到的呢?

最佳答案

据我所知,标准中没有任何内容表明使用不确定值始终是未定义的行为。

被阐明为调用未定义行为的情况是:

  • 如果该值恰好是陷阱表示。
  • 如果不确定值是自动存储的对象。
  • 如果该值是指向生命周期已结束的对象的指针。

举个例子,C 标准指定类型 unsigned char 没有填充位,因此它的任何值都不能是陷阱表示。

诸如memcpy之类的函数的可移植实现利用这一事实来执行任何值的复制,包括不确定的值。当用作包含填充位的类型的值时,这些值可能是陷阱表示,但当用作 unsigned char 的值时,它们只是未指定。

<小时/>

我认为,如果某个东西可以调用未定义的行为,那么当程序没有安全的检查方式时,它确实会调用未定义的行为,这是错误的假设。考虑以下示例:

int read(int* array, int n, int i)
{
if (0 <= i)
if (i < n)
return array[i];
return 0;
}

在这种情况下,read 函数没有安全的方法来检查 array 是否确实具有(至少)长度 n。显然,如果编译器将这些可能的UB操作视为确定的UB,那么几乎不可能编写任何指针代码。

更一般地说,如果编译器无法证明某个东西是 UB,它就必须假设它不是 UB,否则就有破坏一致性程序的风险。

<小时/>

唯一将可能性视为确定性的情况是自动存储对象的情况。我认为可以合理地假设,这是因为这些情况可以被静态拒绝,因为编译器需要的所有信息都可以通过本地流分析获得。

另一方面,将其声明为非自动存储对象的 UB 不会为编译器提供任何在优化或可移植性方面有用的信息(在一般情况下)。因此,该标准可能不会提及这些情况,因为无论如何它都不会改变实际实现中的任何内容。

关于c - 读取不确定值会调用 UB?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40584969/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com