gpt4 book ai didi

mysql - 1 张非常大的 table 还是 3 张大 table ? MySQL 性能

转载 作者:行者123 更新时间:2023-11-29 06:41:53 25 4
gpt4 key购买 nike

假设一个非常大的数据库。一张有 9 亿条记录的表。

方法一:
表:帖子

+----------+-------------- +------------------+----------------+
| id (int) | item_id (int) | post_type (ENUM) | Content (TEXT) |
+----------+---------------+------------------+----------------+
| 1 | 1 | user | some text ... |
+----------+---------------+------------------+----------------+
| 2 | 1 | page | some text ... |
+----------+---------------+------------------+----------------+
| 3 | 1 | group | some text ... |

// row 1 : User with ID 1 has a post with ID #1
// row 2 : Page with ID 1 has a post with ID #2
// row 3 : Group with ID 1 has a post with ID #3

目标是在一个页面中显示来自所有 3 个 post_types 的 20 条记录。

SELECT * FROM posts LIMIT 20

但我担心这种方法的记录数

方法B:
将 9 亿条记录分成 3 个表,每个表 3 亿条。

表:用户帖子

+----------+-------------- +----------------+
| id (int) | user_id (int) | Content (TEXT) |
+----------+---------------+----------------+
| 1 | 1 | some text ... |
+----------+---------------+----------------+
| 2 | 2 | some text ... |
+----------+---------------+----------------+
| 3 | 3 | some text ... |

表:页面帖子

+----------+-------------- +----------------+
| id (int) | page_id (int) | Content (TEXT) |
+----------+---------------+----------------+
| 1 | 1 | some text ... |
+----------+---------------+----------------+
| 2 | 2 | some text ... |
+----------+---------------+----------------+
| 3 | 3 | some text ... |

表:群组帖子

+----------+----------------+----------------+
| id (int) | group_id (int) | Content (TEXT) |
+----------+----------------+----------------+
| 1 | 1 | some text ... |
+----------+----------------+----------------+
| 2 | 2 | some text ... |
+----------+----------------+----------------+
| 3 | 3 | some text ... |

现在获取要显示的 20 个帖子的列表

SELECT * FROM User_Posts LIMIT 10
SELECT * FROM Page_Posts LIMIT 10
SELECT * FROM group_posts LIMIT 10

//并创建结果数组或对象。并在输出中显示。

在这个方法中,我应该在php中将它们排序到一个数组中,然后将它们semd到页面。

首选哪种方法?
9亿条记录的表分三表会影响mysql的读写速度吗?

最佳答案

这实际上是关于 Singe - Table - Inheritance 与 Table Per Class Inheritance 和 missing out joined inheritance 的讨论。前者与方法 A 相关,第二个与您的方法 B 和方法 C 相关,就像将帖子的所有 ID 都放在一个表中并推迟组或用户的特定属性 - 将帖子 ij 发布到不同的表。虽然拥有一个大表总是有其与表全扫描相关的负面影响,但拆分表的方法也有其自身的影响。这取决于您的应用程序需要访问整个帖子列表的频率与仅检索特定帖子类型的频率。您应该考虑的另一个考虑因素是数据分区,它可以使用 MySQL 或 Oracle 数据库完成,例如这是一种在表中组织数据的方式,为信息生命周期提供了机会(访问哪些数据的时间和频率,可以移动和压缩部分数据,减少数据库大小并提高访问数据左侧部分的速度)表),基本上分为三种主要技术:基于范围的分区、基于列表的分区和基于散列的分区。其他不那么普遍支持的与减小表大小相关的功能是处理带有时间戳的插入,在特定时间段过期后自动使插入的数据无效。真正是一个主要的应用程序设计决策并且可以提高性能的是在应用程序级别区分对数据库的读取和写入访问。考虑一个 MySQL - 后端:因为写访问显然对数据库性能比读访问更重要,所以你可以设置一个 MySQL - 用于写入数据库的实例和另一个作为读访问的副本的实例,尽管这也是可以讨论的,主要是当它谈到 RDT(实时决策),其中任何给定时间的数据绝对一致性是必须的。使用对象池作为应用程序和数据库之间的层也是一种提高应用程序性能的技术,尽管我还不知道 PHP 世界中的现有解决方案。 Oracle Hot Cache 是一个非常复杂的例子。不过,您可以构建自己的一个基于内存数据库或使用内存缓存的实现。

关于mysql - 1 张非常大的 table 还是 3 张大 table ? MySQL 性能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20976146/

25 4 0