gpt4 book ai didi

scalability - 有谁知道臭名昭著的 NSA 调用数据库的 DBMS 是什么?

转载 作者:搜寻专家 更新时间:2023-10-30 19:44:39 24 4
gpt4 key购买 nike

Another question on SO突然让我想知道世界上最大的数据库是什么(以及它有多大)。一个快速的谷歌搜索出现了这个:NSA call database ,由美国国家安全局创建。据推测,该数据库包含超过 1.9 万亿条记录,其中包含早在 2001 年就通过 AT&T 和 Verizon 拨出的电话的详细信息。

有谁知道这个数据库使用了什么样的数据库系统? 1.9 万亿条记录在我看来比典型的大型商业数据库要多得多。但也许我错了。我也没有以任何方式对此进行广泛的研究,所以 NSA 调用数据库是世界上最大的说法也许是完全错误的。

不过,我很想知道哪种 DBMS(如果有的话)可以合理地处理这么多记录。

最佳答案

1.9 万亿行乘以 8000 字节/行等于 15 PB?我做的算术正确吗?这只比几个著名的商业数据库大一个数量级。谷歌搜索“拍字节数据库”给了我

  • ebay:一个 2+ PB 数据仓库和一个 6+ PB 数据仓库(2009)
  • facebook:2+ PB 数据仓库(2010)
  • 沃尔玛:2+ PB 数据仓库(2010)
  • 美国银行:1+ PB 数据仓库(2010)
  • 戴尔:1+ PB 数据仓库(2010)

1.9 万亿行在 64 位无符号整数范围内很容易(咳嗽)行寻址。

物理学家和天文学家似乎是最大的目标。斯坦福大学需要为其大型天气观测望远镜管理大约 155 PB 的数据。我所在街道的一个天文学项目每天产生大约 10 PB 的数据,但它们存储的数据几乎没有那么多。

哎呀,我差点忘了问题的重点。 Greenplum 和 Teradata 出现的次数最多。但我认为任何知道 NSA 实际使用什么的人都不会谈论它。

@Tomislav Nakic-Alfirevic:每 1000 行打印一次的 awk 程序:

NR % 1000 == 0 {print $0}

你认为 NSA 会为此付钱给我吗?我的房子需要一个新屋顶。

关于scalability - 有谁知道臭名昭著的 NSA 调用数据库的 DBMS 是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2401637/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com