database - 分片对性能有何影响？-6ren

database - 分片对性能有何影响？

转载作者：搜寻专家更新时间：2023-10-30 19:46:20

26

4

我是分片的新手，想知道分片对各种查询有什么影响。对于名为“people”的示例数据集:

person_id | person_fname | person_lname | person_dob
----------------------------------------------------
1         | John         | Smith        | 1972-03-04
2         | Sally        | Jones        | 1968-09-14
3         | Phil         | Forrester    | 1976-11-25
4         | Gwen         | Langley      | 1955-04-20
5         | Pedro        | Romero       | 1962-12-21
6         | Gene         | Halford      | 1978-01-11
7         | Juan         | Peza         | 1977-08-07
8         | Pierre       | Henry        | 1980-04-30

通过创建代理身份“id”的散列，数据在四个节点之间平均分片。但是，您需要对可能跨越所有节点的记录执行读写操作，例如:

SELECT person_fname, 
       person_lname 
FROM   people 
WHERE  person_dob > '1970-01-01'

或者假设您还有一个“订单”表，它引用了“person_id”列中的“people”，并且想要执行连接...

SELECT    order_id,
          order_amount,
          order_date,
          person_fname,
          person_lname
FROM      orders
LEFT JOIN people
WHERE     order_amount > 50

实际上所有节点都将并行运行查询吗？我假设每台服务器在每个步骤中要做的工作更少，而不是一个实例同时运行八个记录的查询，四个实例将同时运行两个(ish)记录的查询，进一步的好处是如果 DBMS能够执行分片选择然后其他节点不需要继续执行任何进一步的指令，这个假设是否正确？

分片和复杂连接是否有任何已知的性能影响(除了这个简单示例之外)？

最佳答案

它确实允许并行完成。

如果连接必须跨越不同的分片，它确实会使连接变得复杂，因此速度变慢。

但是，对于多对一，如果您有例如orders 以这样的方式分片，即 orders 表中的所有行都与 people 表中的相关行在同一个分片中，然后这个不会发生跨分片问题。

您需要设计您的分片方法，以便您会遇到很多这样的情况，并且很少(最好没有)最终交叉分片。

您还希望将分片放在您实际最常寻找的键上。例如。如果您通过用户名找到人作为其他一切的起点，那么您希望通过用户名而不是 id 进行分片，因为当找到他们时您已经知道要击中哪个分片，而不是必须击中所有的人只是为了从大多数返回零行。

关于database - 分片对性能有何影响？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/12157026/

26

4

0

文章推荐： java - 使用 Liquibase 和 Spring 合并来自数据库的值

文章推荐： sql - 在 blob 上选择不同的

文章推荐： objective-c - 沿圆弧变换路径

elasticsearch - 分片/副本未分配到另一台计算机上的新节点上
我是ElasticSearch的新手，并且一直在使用它的功能。我在单个计算机上运行单个节点(master = true，data = true)。我创建一个索引，其中包含3个分片和每个分片1个副本。
elasticsearch - 分片/副本设置可实现高可用性
我们在14个节点的集群中具有嵌入式Elasticsearch的Java应用程序。所有数据都驻留在中央数据库中，并在elasticsearch中对其进行索引以进行查询。完整的索引编制可以随时进行。系统
MongoDB 分片 + 复制
我是 MongoDB 的新手，我想了解这两种技术如何协同工作: 当为你的数据库使用复制时，你有一个主节点和一堆辅助节点。为了保证一致性，建议大家始终从主节点读取，对吧？因此，当您将复制与分片结合使用
一台机器上的 MongoDB 分片
有人告诉我，在一台更强大的机器上使用 100 个分片实现 mongodb 分片以实现更高的并发写入数据库是否有意义，每个 monogod.exe 进程都有一个全局锁？假设这是可能的，这种方法会给我更高
Mongodb - 分片 - 同时添加多个分片
我有一个带有 4x 分片的生产 mongodb 部署 (3.6)，它运行良好。我想向集群中添加 4 倍以上的分片。一次添加多个分片是否可以，或者这会引起戏剧性事件吗？我发现添加分片是一项昂贵的操作，在
Redis 分片、流水线和往返
假设在您的 Web 应用程序中，您需要调用多个 Redis 来呈现页面，例如获取一堆用户哈希。为了加快速度，您可以将 redis 命令包装在 MULTI/EXEC 部分，从而使用流水线，从而避免进行多
elasticsearch - 分片(Elasticsearch)是否有自己的JVM设置
我正在查看ES文档，并看到以下内容 Each shard is in itself a fully-functional and independent "index" that can be hos
elasticsearch - Elasticsearch 分片/路由
我有一个 Multi-Tenancy 系统，并且我正在尝试设计ElasticSearch以支持 Multi-Tenancy 。我已经在网上搜索过，但是我发现的所有帖子在实践中均未指定具体操作方法。基
mongodb - 分片 Mongodb 随机停止
我已经在 kuberenetes 中使用散列分片设置了分片 MongoDB 集群。我首先创建了配置服务器 Replicaset，然后创建了 2 个分片副本集。最后创建了mongos来连接分片集群。我
elasticsearch - 是否可以找到文档所在的 elasticsearch 分片？
我在调试父子关系查询时遇到问题。我想知道调试问题的方法，而不是简单地发布我的映射、数据、查询并询问问题所在(但我最终保留这样做的权利!)。为此，首先要检查我的 child 和关联的 parent 是
python - 分片 Django 项目
我正在启动一个 Django 项目，需要对多个可能包含太多行的表进行分片。我浏览了这里和其他地方的线程，并遵循了 Django 多数据库文档，但我仍然不确定它们是如何缝合在一起的。我的模型具有会被分片
mongodb - Docker mongo 分片
我正在尝试使用 docker 创建 mongo 分片.我有: 配置服务器: docker run -it --rm --net=xnet -p 27016:27016 \ --hostname
Mongodb 分片 - 没有这样的命令 : 'addShard'
我正在尝试在一台机器上配置分片，但在尝试添加分片时我不断收到错误消息。我使用以下网站作为引用:http://www.javahotchocolate.com/notes/mongodb-shardin
mongodb 分片 - block 的大小不同
我刚接触 mongodb。由于我必须存储 +-5000 万份文档，我不得不设置一个带有两个副本集的 mongodb 分片集群文档看起来像这样: { "_id" : "predefined_u
mongodb - 何时开始 MongoDB 分片
目前我们运行一个包含 2 个服务器 + 1 个仲裁器的 MongoDB 复制集。我们在副本集的数据库中存储了大约 150 GB 的数据。现在我们正在考虑何时开始分片。因为我们想知道是否存在不能再开
c# - 散列/分片 ActionBlocks
我需要并行处理某些项目，所以我使用 TPL Dataflow。 .要注意的是，共享相同键(类似于字典)的项目应按 FIFO 顺序处理，而不是彼此平行(它们可以与具有不同值的其他项目平行)。正在完成的
redis - 分片 Redis 中的搜索和事务
问题涉及redis的分片配置。我已经用 Java 实现了一个小型测试应用程序，它以 user:userID 的形式在 Jedis 上创建了 100.000 个用户哈希。每个散列都有元素:姓名、电话、部
redis - 访问多个 Redis 分片
您好，我将使用多个 Redis 实例和实例之间的一些分片。我的问题是，如果加载网页需要访问多个分片，性能是否会受到[明显的影响]。我的基本概述是在多个 Redis 分片之间实现负载平衡*下面的脚注
redis - Predis 分片(一致性哈希)
Predis 声称拥有客户端分片(支持键的一致性散列)。 http://github.com/nrk/predis 我可以使用连接到一组配置文件(节点)来进行分片，但它不是一致的哈希。当我将另一个节点
mysql - NewSQL 与传统优化/分片
就目前而言，这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持，但这个问题可能会引起辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the he

首页

博学

6Ren·AI

商城

database - 分片对性能有何影响？