gpt4 book ai didi

mysql - 用于分层过滤的 RDBMS 数据库术语

转载 作者:行者123 更新时间:2023-11-29 13:26:03 25 4
gpt4 key购买 nike

我们的项目正在寻求建立一个大型数据库,我正在寻找术语、技术和/或技术来研究我们的实现。我怀疑我们的项目是否是新项目,但希望利用现有的常见实践(而不是从头开始学习)。

我们项目的一个人为但非常适用的示例是这样的层次结构:

  • 将存在一些出版社(总共10家)

  • 出版社将拥有出版商(总共 100 个)

  • 出版商将拥有作者(总共 1000 位)
  • 作者将拥有书籍(顺序为总计 10000)

  • 会有读者对书籍进行记录/评论(顺序总计 5M)

我们系统的一个常见报告项目是出版商或作者登录系统并收集读者的评论。诀窍是,他们必须只能看到与他们控制的图书关联的读者。

我们担心的是,每个举报操作查询都必须筛选 500 万读者评论,以了解它们是否与相关出版社、出版商、作者和/或图书匹配。

最适合解决此问题的术语、技巧和/或技术是什么?您能解释一下为什么这适用于我们的问题集吗?我还有更多研究要做,但希望您的经验和答案能为我们指明正确的方向。

谢谢!

(仍然需要更多信息,但我当前的解决方案是一些用于出版商到出版商、出版商到作者、作者到书籍的连接表,并在查找读者时使用级联连接以确保我拥有正确的集合。我听过一些谈话有关“ View ”的信息也可能适用于此处)。

最佳答案

听起来像是关系数据库(MySQL、Oracle 等)的经典用例。我不会太担心有 5M 行,如果查找列被索引(即您使用一些额外的磁盘空间但获得快速查找),您将能够毫无问题地搜索和加入。

如果您的“顺序”值在正确的范围内,那么您正在查看类似 10,000,000,000 本书的内容,因此这将是您的主要大小问题。每条评论只有区区 1000 个字符,仅这些评论就需要查看 10TB 的数据。在这种规模下,可能值得开始考虑 Hadoop/Hbase 等“大数据”解决方案。然而,这些通常没有针对快速查找进行优化,而是更多地为批处理作业分析而设计,因此需要根据您的需要进行一些调整。

希望有帮助!

关于mysql - 用于分层过滤的 RDBMS 数据库术语,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20124649/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com