gpt4 book ai didi

mysql - 如何处理庞大的数据集

转载 作者:行者123 更新时间:2023-12-04 03:35:52 26 4
gpt4 key购买 nike

<分区>

这些天我正在阅读有关管理 MySQL 数据库中庞大数据集的不同方法。

老实说,此刻,我很困惑。我阅读了有关上述问题的一些概念,但我不知道它们之间有何关联?

请看看这些:

  • Partitioning - 这是一个插件
  • 集群 - 我猜命名为 NDB
  • 分片 - 我认为这是一个概念,没有任何可实现的

场景是在 MySQL 中存储/维护/搜索大量数据(假设一个表有 50 亿行)。所以我们必须拆开数据集,但是如何拆开呢?

我有几个问题:

  1. 以上三项之间有多少重叠?
  2. 在分区时,所有部分将存储在同一台机器(服务器)上?或者它们可以保存在不同的机器中?
  3. 如何检测数据存储在哪个分区? (以便相应地查找数据)
  4. 我知道分区是针对“表”的,集群是针对“数据库”的吗?
  5. 通过分片,我们将数据复制到不同的服务器中,或者我们会在不同的服务器中拥有不同的数据?还有,是发生在“表”层还是“数据库”层?
  6. 不同部分(集群/分区)在需要时如何相互查看?就像我们需要在整个表上有一个 join 子句一样。假设数据分布在不同的分区/机器中。
  7. 要使用集群,我需要安装不同版本的 MySQL 吗?普通版不支持吗?

无论如何,我已经阅读了超过 3 天的内容,但主要概念对我来说仍然模棱两可。

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com