gpt4 book ai didi

mysql 分区由 varchar - 随机行为?

转载 作者:行者123 更新时间:2023-11-29 03:27:10 25 4
gpt4 key购买 nike

我正在尝试熟悉 MySQL Cluster Community Server(版本:5.6.27-ndb-7.4.8-cluster-gpl),但第一个问题让我很困惑。我搜索了文档和论坛,但没有找到相关内容。

我在具有 4 个数据节点/分区的集群上有一个非常简单的表:

CREATE TABLE customer (   
id int(10) NOT NULL ,
surname varchar(35) NOT NULL,
gender varchar(6) NOT null,
primary key(id, surname, gender)
)ENGINE=NDBCLUSTER DEFAULT CHARSET=latin1 PARTITION by key (gender);

因此,我选择按性别进行分区(它采用男/女值)。我插入 1000 行,我想看看它们是如何分布的:

SELECT partition_name, table_rows   
FROM information_schema.PARTITIONS
WHERE table_name='customer';

结果:

partition_name, table_rows

'p0', '0'
'p1', '1000'
'p2', '0'
'p3', '0'

所以所有的行都进入一个分区。

但是,如果我将性别定义为 nvarchar(6) 或 varchar(40),则行会像我期望的那样分布在两个分区中

partition_name, table_rows

'p0', '493'
'p1', '0'
'p2', '507'
'p3', '0'

如果我将性别提高到 varchar(60),所有记录都会进入一个分区。如果我将它提高到 varchar(100),记录将均匀分布在两个分区之间。

这背后有什么逻辑吗,还是我做错了什么?

最佳答案

doc says ,

Partitioning by key is similar to partitioning by hash, except that where hash partitioning employs a user-defined expression, the hashing function for key partitioning is supplied by the MySQL server. This internal hashing function is based on the same algorithm as PASSWORD().

MySQL 正在通过一个任意的、对您来说实现者不可预测的散列函数为该列运行您的两个值(MaleFemale)。在某些情况下,哈希函数会为这两个值产生相同的输出,而在另一些情况下,它会产生不同的值。因此,有时您的所有行最终都在一个特定的分区中,有时它们最终在两个分区中。

像您选择的列那样,不同值的数量很少,不是(Obvious Man 说)散列或键分区的好选择。 Range partitioning可能更合适。

关于mysql 分区由 varchar - 随机行为?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34575699/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com