gpt4 book ai didi

c - 我什么时候应该只使用 "int"而不是更多特定于符号或特定于大小的类型?

转载 作者:太空狗 更新时间:2023-10-29 16:17:48 26 4
gpt4 key购买 nike

我有一个 little VM for a programming language用 C 实现。它支持在 32 位和 64 位架构以及 C 和 C++ 下编译。

我试图让它在尽可能多的警告的情况下干净利落地编译。当我打开时 CLANG_WARN_IMPLICIT_SIGN_CONVERSION ,我收到了一连串的新警告。

我想有一个关于何时使用的好策略 int与显式无符号类型和/或显式大小的类型相比。到目前为止,我在决定该策略应该是什么方面遇到了麻烦。

混合它们当然是正确的 - 主要使用 int对于诸如局部变量和参数之类的东西以及对结构中的字段使用更窄的类型——会导致许多隐式转换问题。

我确实喜欢为 struct 字段使用更具体的大小类型,因为我喜欢显式控制堆中对象的内存使用的想法。另外,对于哈希表,我在哈希时依赖无符号溢出,所以如果哈希表的大小存储为 uint32_t 就好了。 .

但是,如果我尝试在任何地方使用更具体的类型,我会发现自己到处都是扭曲的类型转换。

其他 C 项目是做什么的?

最佳答案

只在任何地方使用 int 似乎很诱人,因为它最大限度地减少了转换的需要,但是您应该注意几个潜在的陷阱:

  • int 可能比您预期的要短。 尽管在大多数桌面平台上, int 通常是 32 位, the C standard only guarantees a minimum length of 16 bits 。您的代码是否需要大于 216−1 = 32,767 的数字,即使是临时值?如果是这样,请不要使用 int 。 (您可能希望使用 long 代替;long 保证至少为 32 位。)
  • 即使是 long 也可能并不总是足够长。 特别是,不能保证数组(或字符串,即 char 数组)的长度适合 long 。对于那些使用 size_t (或 ptrdiff_t ,如果您需要有符号差异)。

    特别是 a size_t is defined to be large enough to hold any valid array index ,而 int 甚至 long 可能不是。因此,例如,当迭代一个数组时,您的循环计数器(及其初始/最终值)通常应该是 size_t ,至少除非您确定该数组足够短以便较小的类型可以工作。 (但在向后迭代时要小心:size_t 是无符号的,所以 for(size_t i = n-1; i >= 0; i--) 是一个无限循环!使用 i != SIZE_MAXi != (size_t) -1 应该可以工作;或者使用 do 循环,但 079104 的情况下 while/079104 4579104 4579104
  • n == 0 已签名。 特别是,这意味着 int overflow is undefined behavior. 如果您的值有可能合法溢出的任何风险,请不要使用 int ;改用 int (或 unsigned intunsigned long )。
  • 有时,您只需要固定的位长。 如果您与 ABI 接口(interface)或读取/写入文件格式,需要特定长度的整数,那么这就是您需要使用的长度。 (当然,在这种情况下,你可能还需要担心字节序之类的事情,所以有时可能不得不求助于手动逐字节地打包数据。)

  • 尽管如此,也有理由避免一直使用定长类型:不仅 uintNN_t 一直难以输入,而且强制编译器始终使用 32 位整数并不总是最佳的,尤其是在平台上其中原生 int32_t 大小可能是 64 位。例如,您可以使用 C99 int ,但这更难打字。

    因此,以下是我个人对最大安全性和便携性的建议:
  • 定义您自己的整数类型以供随意使用 在一个公共(public)头文件中,如下所示:
    #include <limits.h>
    typedef int i16;
    typedef unsigned int u16;
    #if UINT_MAX >= 4294967295U
    typedef int i32;
    typedef unsigned int u32;
    #else
    typedef long i32;
    typedef unsigned long i32;
    #endif

    将这些类型用于类型的确切大小无关紧要的任何内容,只要它们足够大即可。我建议的类型名称既简短又自我记录,因此它们应该很容易在需要的地方使用,并最大限度地减少由于使用太窄的类型而导致的错误风险。

    方便的是,上面定义的 int_fast32_tu32 类型保证至少与 u16 一样宽,因此可以安全使用而不必担心它们是 promoted to unsigned int and causing undefined overflow behavior.
  • 对所有数组大小和索引使用 int,但在它和任何其他整数类型之间进行转换时要小心。或者,如果您不喜欢输入这么多下划线,size_t 也是一个更方便的别名。
  • 对于假设在特定位数溢出的计算,要么使用 typedef ,要么只使用上面定义的 uintNN_t/u16 和显式位掩码 u32 。如果您选择使用 & ,请确保防止意外升级到 uintNN_t ;一种方法是使用宏,例如:
    #define u(x) (0U + (x))

    这应该让您安全地编写,例如:
    uint32_t a = foo(), b = bar();
    uint32_t c = u(a) * u(b); /* this is always unsigned multiply */
  • 对于需要特定整数长度的外部 ABI,再次定义特定类型,例如:
    typedef int32_t fooint32;  /* foo ABI needs 32-bit ints */

    同样,这个类型名称在其大小和用途方面都是自我记录的。

    如果 ABI 可能实际上需要,例如,16 位或 64 位整数,则取决于平台和/或编译时选项,您可以更改类型定义以匹配(并将类型重命名为 int )——但随后每当您向该类型或从该类型转换任何内容时,您确实需要小心,因为它可能会意外溢出。
  • 如果您的代码有自己的结构或需要特定位长的文件格式,请考虑为这些定义自定义类型,就像它是外部 ABI 一样。或者你可以只使用 fooint 来代替,但这样你会失去一点自我文档。
  • 对于所有这些类型,不要忘记还定义相应的 uintNN_t_MIN 常量以便于边界检查。这听起来像是很多工作,但实际上只是单个头文件中的几行。

  • 最后,记住要小心整数数学,尤其是溢出。
    例如,请记住,两个 n 位有符号整数的差值可能不适合一个 n 位 int。 (如果您知道它是非负的,它将适合 n 位无符号整数;但请记住,您需要将输入转换为无符号类型,然后再取它们的差异以避免未定义的行为!)
    类似地,要找到两个整数的平均值(例如,对于二分搜索),不要使用 _MAX ,而是使用例如 avg = (lo + hi) / 2;如果总和溢出,前者将中断。

    关于c - 我什么时候应该只使用 "int"而不是更多特定于符号或特定于大小的类型?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29197964/

    26 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com