- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
在我的情况下,我可以为我的新网站按范围或按列表进行分区,下面是我可以选择的两者的示例,
partition BY LIST(`category`)(
PARTITION p0 VALUES IN(0),
PARTITION p1 VALUES IN(1),
PARTITION p2 VALUES IN(2),
PARTITION p3 VALUES IN(3),
PARTITION p4 VALUES IN(4),
PARTITION p5 VALUES IN(5),
PARTITION p6 VALUES IN(6)
);
或者我可以,
PARTITION BY RANGE (`category`)(
PARTITION p0 VALUES LESS THAN (1),
PARTITION p1 VALUES LESS THAN (2),
PARTITION p2 VALUES LESS THAN (3),
PARTITION p3 VALUES LESS THAN (4),
PARTITION p4 VALUES LESS THAN (5),
PARTITION p5 VALUES LESS THAN (6),
PARTITION p6 VALUES LESS THAN (7)
);
因为我对分区一无所知,所以选择哪个更好?
我还发现我也可以做这样的事情,
partition BY HASH(`category`)
partitions 7;
是否有更好的选择,或者真的没有关系吗?
作为最后一个问题 - 我有 7 个不同的类别。如果我使用超过 7 个分区,选择最后一个选项会怎样?这样做是不是很愚蠢,或者它会提高性能。
感谢您花时间阅读我的问题!
最佳答案
MySQL 中有 4 种可用的分区策略:RANGE、LIST、KEY 和 HASH。
如果您需要按分区列的特定值进行分区,RANGE 和 LIST 就是为此目的而设计的。如果您不需要通过列的特定值为文件分配行,那么 KEY 和 HASH 更适合您。
在您的情况下,所有三种方法(LIST、RANGE 和 HASH)的工作方式完全相同,因为您有 7 个分区,并且 `category` = 0 的行将存储在 p0 中,`category` = 1 存储在 p1 中等等。
在 HASH 分区中,为了确定哪个文件将用于存储特定行,MySQL 使用模 (mod) 操作:
partition_number = hash(partitioning_column) mod number_of_partitions
在您的 HASH 情况下,分区号将是:
partition_number = category mod 7
(您没有使用任何哈希函数,因此默认使用identity)。
创建比值更多(或更少)的分区可以具有分区列不一定无用,但如果您使用身份作为哈希函数,那么创建更多分区是无用的。
假设您只有 7 个类别,但定义了 20 个分区:
PARTITION BY HASH(`category`)
PARTITIONS 20;
由于 0 mod 7 = 0、1 mod 7 = 1、2 mod 7 = 2、3 mod 7 = 3、4 mod 7 = 4、5 mod 7 = 5 和 6 mod 7 = 6,其余分区(p7-p19) 永远不会被使用。它不会提高或降低性能,只是没用。
现在假设您仍然有 7 个类别,但只有 4 个分区:
PARTITION BY HASH(`category`)
PARTITIONS 4;
0 mod 4 = 0, 1 mod 4 = 1, 2 mod 4 = 2, 3 mod 4 = 3, 4 mod 4 = 0, 5 mod 4 = 1, 6 mod 4 = 2。
发生了什么事?文件 p0 将包含“category”= 0 和“category”= 4 的行,p1 将包含“category”= 1 和“category”= 5 的行,p2 将包含“category”= 2 和“category”的行` = 6 并且 p3 将仅包含 `category` = 3 的行。
这会提高还是降低性能?这取决于您在此表上运行的 SELECT 查询。如果您运行这样的查询:
SELECT * FROM `table_name` WHERE `category` = 0 or `category` = 4;
非常完美,因为只会访问一个分区。但是另一个例子是相反的:
SELECT *
FROM `table_name`
WHERE `category` = 0 OR `category` = 1 OR `category` = 2 OR`category` = 3;
需要访问所有分区以检索数据。
如果您键入以下内容,MySQL 会为您提供此信息:
EXPLAIN PARTITIONS SELECT_QUERY;
example: EXPLAIN PARTITIONS SELECT * FROM `table_name` WHERE `category` = 0 or `category` = 4;
关于使用哪种替代方案,因为 LIST 和 RANGE 分区旨在指定一个列表或一系列值,并且每个分区只有一个值,在这种情况下我会选择 HASH 分区 .
关于mysql - 按范围或按列表分区 - Mysql?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11114023/
是一种在 Neo4j 分区之间进行物理分离的方法吗? 这意味着以下查询将转到 node1: Match (a:User:Facebook) 虽然此查询将转到另一个节点(可能托管在 docker 上)
我尝试在我的 SQL 服务器上使用分区函数对我的一个大表进行分区,但我收到一条错误消息 “只能在SQL Server企业版中创建分区功能。只有SQL Server企业版支持分区。” 所以我想知道没有企
在hadoop文件系统中,我有两个文件,分别是X和Y。通常,hadoop制作的文件X和Y的大小为64 MB。是否可以强制hadoop划分两个文件,以便从X的32 MB和Y的32 MB中创建一个64 M
据我了解,如果我们有一个主键,则使用该键对数据进行分区并将其存储在节点中(例如使用随机分区器)。 现在我不确定的是,如果我有多个键(又名复合键),是用于分区数据的键的组合还是它将是第一个主键? 例如,
我正在向我的 SSAS 多维数据集添加分区,我想知道是否有多个分区可以保留在下面?多少太多了,最佳实践限制是 20 还是 200?有没有人可以分享任何真实世界的知识? 最佳答案 这是 another
我有一个包含大约 200 万条记录的大表,我想对其进行分区。 我将 id 列设置为 PRIMARY AUTO_INCRMENT int (并且它必须始终是唯一的)。我有一列“theyear”int(4
我正在做 mysql 列表分区。我的表数据如下 ---------------------------------------- id | unique_token | city | student_
我有一个表,我们每天在其中插入大约 2000 万个条目(没有任何限制的盲插入)。我们有两个外键,其中一个是对包含大约 1000 万个条目的表的引用 ID。 我打算删除此表中超过一个月的所有数据,因为不
我想在一款足球奇幻游戏中尝试使用 MySQL Partitioning,该游戏的用户分布在联赛中,每个联赛都有一个用户可以买卖球员的市场。当很多用户同时玩时,我在这张表中遇到了一些僵局(在撰写本文时大
我是 jQuery 的新手,想知道是否可以获取一些变量并将它们的除法作为 CSS 宽度。到目前为止我在这里: var x = $(".some-container").length; var y =
所以我正在做家庭作业,我需要为分区、斯特林数(第一类和第二类)和第一类的切比雪夫多项式创建递归函数。我的程序应该能够让用户输入一个正整数 n,然后创建名为 Partitions.txt、Stirlin
我在数据框中有一列,其中包含大约 1,4M 行聊天对话,其中每个单元格中的一般格式为 (1): “名称代理 : 对话” 但是,并非列中的所有单元格都采用这种格式。有些单元格只是 (2): “对话” 我
我在尝试隐藏 a 时遇到了一些问题,直到用户单击某个元素为止。 HTML 看起来像: BRAND item 1 item 2 item 3
一.为什么kafka要做分区? 因为当一台机器有可能扛不住(类比:就像redis集群中的redis-cluster一样,一个master抗不住写,那么就多个master去抗写)
我有一些销售数据,我需要发送存储在单独表中的可用槽中的数量。 销售数据示例: id数量112131415369 create table sales (id serial primary key, q
我计划设置多个节点以使用 glusterfs 创建分布式复制卷 我使用主(也是唯一)分区上的目录在两个节点上创建了一个 gluster 复制卷。 gluster volume create vol_d
我正在尝试使用 sum() over (partition by) 但在总和中过滤。我的用例是将每个产品的 12 个月累计到一个月的条目,因此: ITEM MONTH SALES Item
是否可以创建多个 Enumerators出单Enumerator ? 我正在寻找的相当于 List.partition返回 (List[A], List[A]) ,比如 List().partitio
我正在创建一个基于 x86 的非常简单的 Yocto 图像。 我希望/文件系统是只读的,所以我设置了 IMAGE_FEATURES_append = " read-only-rootfs " 在原件的
是否可以使用一次 collect 调用来创建 2 个新列表?如果没有,我该如何使用分区来做到这一点? 最佳答案 collect(在TraversableLike上定义并在所有子类中可用)与集合和Par
我是一名优秀的程序员,十分优秀!