gpt4 book ai didi

c - c中的UTF-8编码

转载 作者:行者123 更新时间:2023-11-30 18:58:05 26 4
gpt4 key购买 nike

什么是 UTF-8编码?我用谷歌搜索但无法理解它是什么。请用简单的语言和例子来解释。

接下来我需要对 UTF-8 中的一个字符串进行编码编码。我得到了openssl但它仅转换为 base64格式。

#include<stdio.h>

struct some
{
char string[40];
};

int main()
{
string *s;
char str[9];
gets(str);
strcpy(s,str);
/*Now how to get emcoded form of "Hello" in UTF-8*/
/*printf("encoded data");
return 0;
}

这些字符串可在 runtime 处获取。所以不要对即将发生的事情做任何事。编码后需要将它们存储在DB中.

我在SO上检查过但在 c 中找不到任何来源,可在 .net 中找到。 java c# 。我正在使用linux Redhat .

最佳答案

编码描述了哪些字节或字节序列对应于哪些字符。 ASCII 是最简单的编码。在 ASCII 中,单个字节值对应于单个字符。不幸的是,世界上的角色数量超过 255 个。 UTF-8 可能是最常见的编码格式,因为它与英语 ASCII 兼容,但也允许使用国际字符。如果你用 C 编写一个标准的英文字符串,它已经是 UTF-8 了。 “你好”==“你好”

Joel 有一篇关于这个主题的精彩文章,名为:The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!)

它很好地解释了 ASCII、unicode 和 UTF8 字符串编码。

In UTF-8, every code point from 0-127 is stored in a single byte. Only code points 128 and above are stored using 2, 3, in fact, up to 4 (not 6, corrected by R.) bytes.

关于c - c中的UTF-8编码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18474041/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com