gpt4 book ai didi

database - 关于构建快速分布式数据库的建议

转载 作者:搜寻专家 更新时间:2023-10-30 20:32:58 28 4
gpt4 key购买 nike

我目前正在处理一个涉及查询大量数据(数十亿行)的问题,并且我对这类事情有点缺乏经验,希望得到一些聪明的建议。

数据/问题如下所示:

  1. 每个表有 2-5 个键列和 1 个值列。
  2. 每一行都有唯一的键组合。
  3. 我需要能够通过键的任何子集(即 key1='blah' 和 key4='bloo')进行查询。
  4. 如果能够快速插入新行(如果该行已存在则更新值)会很好,但如果我能慢慢地插入,我会很满意。

目前我在一台机器上运行的 MySQL 中实现了这个,每个键上定义了单独的索引,一个索引跨所有键(唯一)和一个索引组合第一个和最后一个键(这是我目前最常见的查询)我正在制作,但这很容易改变)。不幸的是,这非常慢(索引最终占用了大约 10 倍的磁盘空间,这不是一个大问题)。

我碰巧有一群快速计算机可供使用(约 40 台),这使得这个单机数据库令人难以置信的缓慢变得更加烦人。我想利用所有这些功能来加快数据库的速度。我考虑过构建一个分布式哈希表,但这会使仅查询键的一个子集变得困难。 BigTable/HBase 之类的东西似乎是一个不错的解决方案,但我还不确定不存在更简单的解决方案。

非常感谢,任何帮助将不胜感激!

最佳答案

我建议您收听此播客,了解有关分布式数据库的一些重要信息。 episode-109-ebays-architecture-principles-with-randy-shoup

关于database - 关于构建快速分布式数据库的建议,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/930811/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com