gpt4 book ai didi

mysql - utf8_unicode_ci 和 utf8mb4_0900_ai_ci 有什么区别

转载 作者:行者123 更新时间:2023-11-29 01:34:59 25 4
gpt4 key购买 nike

mysql 中utf8mb4_0900_ai_ciutf8_unicode_ci 数据库文本编码有什么区别(尤其是在性能方面)?

更新:

utf8mb4_unicode_ci和utf8mb4_0900_ai_ci有类似的区别吗?

最佳答案

  • 编码 是一样的。也就是说,字节看起来是一样的。
  • 字符集不同。 utf8mb4 有更多的字符。
  • 整理(比较的完成方式)不同。
  • 性能不同,但无关紧要。

utf8_unicode_ci 表示 CHARACTER SET utf8,它仅包含 1、2 和 3 字节的 UTF-8 字符。因此它排除了大多数表情符号和一些汉字。

utf8mb4_unicode_ci 表示 CHARACTER SET utf8mb4 是 4 字节 CHARACTER SET utf8mb4 对应的 COLLATION

多年来,Unicode 组织一直在改进规范。以下是从其“版本”到 MySQL 排序规则的映射:

4.0   _unicode_
5.20 _unicode_520_
9.0 _0900_

大部分差异出现在大多数人从未遇到过的领域。一个例子:在某些时候,一项更改允许以某种方式区分和排序表情符号。

后缀(MySQL doc):

_bin      -- just compare the bits; don't consider case folding, accents, etc
_ci -- explicitly case insensitive (A=a) and implicitly accent insensitive (a=á)
_ai_ci -- explicitly case insensitive and accent insensitive
_as (etc) -- accent-sensitive (etc)

性能:

_bin         -- simple, fast
_general_ci -- fails to compare multiple letters; eg ss=ß, so somewhat fast
... -- slower
_900_ -- (8.0) much faster because of a rewrite

但是:整理速度通常是查询中最不重要的性能问题。 INDEXesJOINs、子查询、表扫描等对性能更为关键。

关于mysql - utf8_unicode_ci 和 utf8mb4_0900_ai_ci 有什么区别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54885178/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com