深入Mysql字符集设置[精华结合]-6ren

深入Mysql字符集设置[精华结合]

转载作者：qq735679552 更新时间：2022-09-29 22:32:09

25

4

CFSDN坚持开源创造价值，我们致力于搭建一个资源共享平台，让每一个IT人在这里找到属于你的精彩世界.

这篇CFSDN的博客文章深入Mysql字符集设置[精华结合]由作者收集整理，如果你对这篇文章有兴趣，记得点赞哟.

基本概念 • 字符(Character)是指人类语言中最小的表义符号。例如'A'、'B'等； • 给定一系列字符，对每个字符赋予一个数值，用数值来代表对应的字符，这一数值就是字符的编码(Encoding)。例如，我们给字符'A'赋予数值0，给字符'B'赋予数值1，则0就是字符'A'的编码； • 给定一系列字符并赋予对应的编码后，所有这些字符和编码对组成的集合就是字符集(Character Set)。例如，给定字符列表为{'A','B'}时，{'A'=>0, 'B'=>1}就是一个字符集； • 字符序(Collation)是指在同一字符集内字符之间的比较规则； • 确定字符序后，才能在一个字符集上定义什么是等价的字符，以及字符之间的大小关系； • 每个字符序唯一对应一种字符集，但一个字符集可以对应多种字符序，其中有一个是默认字符序(Default Collation)； • MySQL中的字符序名称遵从命名惯例：以字符序对应的字符集名称开头；以_ci(表示大小写不敏感)、_cs(表示大小写敏感)或_bin(表示按编码值比较)结尾。例如：在字符序``utf8_general_ci''下，字符``a''和``A''是等价的； MySQL字符集设置 • 系统变量： – character_set_server：默认的内部操作字符集 – character_set_client：客户端来源数据使用的字符集 – character_set_connection：连接层字符集 – character_set_results：查询结果字符集 – character_set_database：当前选中数据库的默认字符集 – character_set_system：系统元数据(字段名等)字符集 – 还有以collation_开头的同上面对应的变量，用来描述字符序。 • 用introducer指定文本字符串的字符集： – 格式为：[_charset] 'string' [COLLATE collation] – 例如： • SELECT _latin1 'string'; • SELECT _utf8 '你好' COLLATE utf8_general_ci; – 由introducer修饰的文本字符串在请求过程中不经过多余的转码，直接转换为内部字符集处理。 MySQL中的字符集转换过程 1. MySQL Server收到请求时将请求数据从character_set_client转换为character_set_connection； 2. 进行内部操作前将请求数据从character_set_connection转换为内部操作字符集，其确定方法如下： • 使用每个数据字段的CHARACTER SET设定值； • 若上述值不存在，则使用对应数据表的DEFAULT CHARACTER SET设定值(MySQL扩展，非SQL标准)； • 若上述值不存在，则使用对应数据库的DEFAULT CHARACTER SET设定值； • 若上述值不存在，则使用character_set_server设定值。 3. 将操作结果从内部操作字符集转换为character_set_results。。

常见问题解析 • 向默认字符集为utf8的数据表插入utf8编码的数据前没有设置连接字符集，查询时设置连接字符集为utf8 – 插入时根据MySQL服务器的默认设置，character_set_client、character_set_connection和character_set_results均为latin1； – 插入操作的数据将经过latin1=>latin1=>utf8的字符集转换过程，这一过程中每个插入的汉字都会从原始的3个字节变成6个字节保存； – 查询时的结果将经过utf8=>utf8的字符集转换过程，将保存的6个字节原封不动返回，产生乱码…… 。

深入Mysql字符集设置[精华结合]

• 向默认字符集为latin1的数据表插入utf8编码的数据前设置了连接字符集为utf8 – 插入时根据连接字符集设置，character_set_client、character_set_connection和character_set_results均为utf8； – 插入数据将经过utf8=>utf8=>latin1的字符集转换，若原始数据中含有/u0000~/u00ff范围以外的Unicode字符，会因为无法在latin1字符集中表示而被转换为“?”(0x3F)符号，以后查询时不管连接字符集设置如何都无法恢复其内容了。。

深入Mysql字符集设置[精华结合]

检测字符集问题的一些手段 • SHOW CHARACTER SET; • SHOW COLLATION; • SHOW VARIABLES LIKE 'character%'; • SHOW VARIABLES LIKE 'collation%'; • SQL函数HEX、LENGTH、CHAR_LENGTH • SQL函数CHARSET、COLLATION 使用MySQL字符集时的建议 • 建立数据库/表和进行数据库操作时尽量显式指出使用的字符集，而不是依赖于MySQL的默认设置，否则MySQL升级时可能带来很大困扰； • 数据库和连接字符集都使用latin1时虽然大部分情况下都可以解决乱码问题，但缺点是无法以字符为单位来进行SQL操作，一般情况下将数据库和连接字符集都置为utf8是较好的选择； • 使用mysql C API时，初始化数据库句柄后马上用mysql_options设定MYSQL_SET_CHARSET_NAME属性为utf8，这样就不用显式地用SET NAMES语句指定连接字符集，且用mysql_ping重连断开的长连接时也会把连接字符集重置为utf8； • 对于mysql PHP API，一般页面级的PHP程序总运行时间较短，在连接到数据库以后显式用SET NAMES语句设置一次连接字符集即可；但当使用长连接时，请注意保持连接通畅并在断开重连后用SET NAMES语句显式重置连接字符集。其他注意事项 • my.cnf中的default_character_set设置只影响mysql命令连接服务器时的连接字符集，不会对使用libmysqlclient库的应用程序产生任何作用！ • 对字段进行的SQL函数操作通常都是以内部操作字符集进行的，不受连接字符集设置的影响。 • SQL语句中的裸字符串会受到连接字符集或introducer设置的影响，对于比较之类的操作可能产生完全不同的结果，需要小心！/P> 。

深入Mysql字符集设置[精华结合]

在 mysql客户端与 mysql服务端之间，存在着一个字符集转换器。

character_set_client =>gbk：转换器就知道客户端发送过来的是gbk格式的编码

character_set_connection=>gbk：将客户端传送过来的数据转换成gbk格式

character_set_results =>gbk:

注：以上三个字符集可以使用set names gbk来统一进行设置

例子:

create table test(

name varchar(64) NOT NULL

)charset utf8;#这里的utf8表示服务器端的字符编码

首先，往数据表test中插入一条数据

inert into test values('测试');

则，数据“测试”在数据库中是以“utf8”格式保存的

过程：

深入Mysql字符集设置[精华结合]

首先，通过mysql客户端，将数据发送给Mysql服务器，经过字符集转换器的时候，由于character_set_connection 值为gbk，所以会将客户端发送过来的数据转为gbk格式，紧接着，字符集转换器将数据要传送给服务器的时候，发现服务器是以utf8保存数据的，所以，在其内部会自动将数据由gbk转换成utf8格式

什么时候会出现乱码？

客户端的数据格式与声明的 character_set_client不符。

通过 header('Content-type:text/html;charset=utf8');将客户端的数据转成utf8格式的，在数据经过“字符集转换器”的时候，由于character_set_client=gbk，而character_set_connection也等于gbk，所以从客户端传送过来的数据（其实是utf8格式）并不会被转换格式。

但是，字符集转换器在讲数据发送给服务器的时候，发现服务器要的格式是utf8，所以会将当前数据当做gbk格式来处理，从而转成utf8（但是，这一步其实已经错了。。。）。

2. result与客户端页面不符合的时候

。

深入Mysql字符集设置[精华结合]

将返回结果的格式设置为utf8，但是客户端接受的格式为gbk，因此会出现乱码

通过show character set 语法，可以显示所有可用的字符集。

latin字符集

深入Mysql字符集设置[精华结合]

注意：Maxlen列显示用于存储一个字符的最大的字节数目。

utf8字符集

深入Mysql字符集设置[精华结合]

gbk字符集

深入Mysql字符集设置[精华结合]

什么时候会丢失数据？

对比以上三幅图可以知道，每种字符集中，用于存储一个字符的最大的字节数目都不同，utf8最大，latin最小。所以在经过字符集转换器的时候，如果处理不当，会造成数据丢失，而且是无法挽回的。

比如：

将character_set_connection的值改为lantin的时候

深入Mysql字符集设置[精华结合]

从客户端发送过来的gbk数据，会被转成lantin1格式，因为gbk格式的数据占用的字符数较多，从而会造成数据丢失

。

深入Mysql字符集设置[精华结合]

总结：

character_set_client和character_set_results 一般情况下要一致，因为一个表示客户端发送的数据格式，另一个表示客户端接受的数据格式为了避免造成数据丢失，需让 character_set_connection的字符编码大于 character_set_client的字符编码。

。

最后此篇关于深入Mysql字符集设置[精华结合]的文章就讲到这里了,如果你想了解更多关于深入Mysql字符集设置[精华结合]的内容请搜索CFSDN的文章或继续浏览相关文章，希望大家以后支持我的博客！。

25

4

0

文章推荐：安装MySQL 5后无法启动(不能Start service)解决方法小结

文章推荐： mysql字符集和校对规则(Mysql校对集)

文章推荐： mysql 常用设置字符集编码、自动完成（自动提示）、监听外网ip

java - Jetty 字符集 utf-8 与字符集 UTF-8
我正在使用使用jetty的Spring-Web应用程序: org.springframework.boot spring-boot-starter-web
字符集 [ ] 中的正则表达式捕获组 ( )
我想匹配空格字符( )仅当它们后跟一个哈希( # )。这是什么( #)下面是尝试做的，这是一个捕获组。 (我尝试转义括号，否则无法在组集中正确识别括号)。但是，这是行不通的。下面的正则表达式 /#
java - 字符集
我正在实现一个词法扫描器。我如何实现字符集？大多数字符集都采用范围形式，即 A-Z、h-L 等。我必须检查字符 ch 是否是字符集的成员。除了数组和位集之外，我可以在 Java 中使用哪种高效的数据结
mySQL 字符集
我今天注意到我们的数据库使用字符集“utf8 -- UTF-8 Unicode”和排序规则“utf8_general_ci”，但里面的大多数表和列都使用 CHARSET=latin1。我会遇到任何问题
Mysql保加利亚语言，字符集
我有一个包含多种语言的 Mysql 表，一种语言一个字段。我的字符集是utf_general_ci 当我用 phpMyAdmin 查看表格时，我有一个保加利亚语页面，如下所示: Ð—Ð° Ð½Ð°Ñ
vb.net 字符集
根据 MSDN vb.net uses this extended character set .根据我的经验，它实际上使用了这个: 我错过了什么？为什么它说它使用一个而使用另一个？难道我做错了什么
查询参数的 Symfony2 字符集
我在 Symfony2 中有一个项目，它在我的本地主机上运行良好，但是在将其移动到外部服务器后问题已经开始。我没有从包含波兰语字符的数据库中看到任何结果名称在 Profiler 中，我检查了查询:
php - CKEditor 字符集
我更新了我的网络应用程序以使用 UTF-8 而不是 ANSI。我做了以下措施来定义字符集: mysql_set_charset("utf8"); // PHP // HTML utf8_gener
c - 字符集/位串的减法运算
typedef unsigned char Set; Set s1,s2; s1 = 0xda; PRINT(s1); printf("%d\n", s1); s2 = -s1; pri
PHP/Mysql 字符集
我有一个 PHP/MySQL 应用程序，它需要在幕后处理 UTF-8 字符(UTF-8 字符不会显示在屏幕上)。 UTF-8 字符来自 PHP cURL 请求。我需要做什么才能使 PHP 和 MyS
用户表的 MySQL 字符集
我正在使用 utf8_general_ci 作为字符集在 MySQL 中构建一个用户表。 1-) 使用这个字符集，两个用户一个叫 Bob 另一个叫 bob 看起来是同一个，对吧？我不知道这可能会导致一
mysql - 更改默认排序规则/字符集
我知道之前已经回答过这个问题，但我发现的解决方案不适用于我的系统(我已经测试过了)。我想更改 Mysql 中的默认排序规则。这似乎设置为 latin1_swedish_ci，我想将其更改为 UTF8
需要 MySQL 字符集
我正在开发一个母语学习应用程序。我需要将一些字符存储为“ẽũ”。我的数据库设置为具有默认排序规则的 utf-8 字符集，以及受此字符影响的表。问题是当我尝试使用常规 SQL 插入添加一行时: INS
html - jsFiddle 字符集
有什么方法可以定义字符集，以及属于的其他信息吗？ jsFiddle 上的标签？我知道他们侧面板的“信息”部分，但不允许标签。提前致谢! 最佳答案是的，把它放在CSS部分: 使用 jQ
对象属性的 javascript 字符集
我正在创建一个对象运行时: var myObj = {}; myObj[propertyName] = propertyValue; propertyName 是变量，如果它像“a.b”，我的对象就有
C:如何将一个字符添加到另一个字符/字符集？
假设我有一个值为 42 (*) 的字符。我需要在 n 行中打印这个字符，n 由用户定义。但是，对于每个换行，都必须打印另一个 *。如果用户输入“6”，那么结果将是这样的: * ** *** ****
c++ - 字符集 - 不清楚
该标准定义了基本源字符集基本执行字符集及其对应的宽字符它还定义了“执行字符集”及其对应的宽字符，如下所示 $2.2/3- "The execution character set and the
Java inputStreamReader 字符集
我想 ping 目标 IP 地址并接收响应。为此，我在 Java 中使用带有 runtime.exec 方法和进程类的 Windows 命令行。我正在使用 inputStreamReader 获取响应
MySQL Workbench 字符集
是否有任何方法可以更改 MySQL Workbench 字符集？我的架构使用 UTF-8，当我查看表数据(另存为 UTF-8)或手动添加数据时，出现字符集错误，可能 MySQL Workbench 使
winapi - 如何确定使用哪个 LOGFONT 字符集？
我有一个文本选择/规范对话框，用户可以从列表中指定字体，设置粗体、斜体等。然后我使用 LOGFONT 中的信息创建一个 CFont 随后在 CEdit 中用作预览。但是，如果用户选择像 Wingdi

首页

博学

6Ren·AI

商城

深入Mysql字符集设置[精华结合]