gpt4 book ai didi

c++ - C++中不同字符类型的使用

转载 作者:太空宇宙 更新时间:2023-11-03 10:29:06 24 4
gpt4 key购买 nike

wchar_t 类型保证足够大以容纳机器最大扩展字符集中的任何字符。那么为什么需要 signed charunsigned char 呢?此外,如果确实有理由在实践中使用后两者,有人可以提供一些小例子来说明何时使用 signed charunsigned char 吗?我问最后一个问题的原因是因为 char 在某些机器上是 signed 而在其他机器上是 unsignedchar 没有默认限定符。 C++ primer 指出,在使用 char 时,您应该明确说明您正在使用哪个版本。我想知道如果机器基本字符集中的字符由整数 0 - 255 表示,为什么我们还要有一个 signed char

最佳答案

几个原因。首先是空间效率:wchar_t 占用的空间比 ASCII 字符所需的空间多(在 Windows 上是两倍,在 Linux 上是四倍),这对单个值来说无关紧要,但对数组来说更重要.每个字符都与最大 Unicode 值一样大的字符串编码称为 UTF-32,顺便说一句,由于这个问题,它没有被广泛使用。有关更智能的编码,请参阅有关 UTF-8 的维基百科文章。

第二个是 char 经常被用作字节可寻址内存的简写。在这种情况下,你真的应该指定它的符号,或者使用 (u)int8_t 或类似的东西,如果你不只是直接复制它们的话。

至于为什么signed/unsigned没有在标准中规定,主要是兼容性问题。以任何一种方式指定它都会破坏某人的旧代码,我们不能这样做,即使从长远来看它会使事情变得更好。 ASCII 无论如何都可以适合 0-127,这可能就是为什么这不是一个大问题。

请注意,您不应该使用char 来存储实际用户可见的字符,以免让非西方用户非常不高兴。 wchar_t 实际上也不正确,至少在 Windows 上是这样;对于大多数 Unicode,它足够大,但不是全部。

关于c++ - C++中不同字符类型的使用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22260093/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com