gpt4 book ai didi

hadoop - 了解 stackoverflow 底层软件基础设施

转载 作者:可可西里 更新时间:2023-11-01 11:22:11 34 4
gpt4 key购买 nike

我想知道堆栈溢出的所有数据库/数据库组合在下面使用什么,管理各种垂直领域的大量用户配置文件信息。

就像 twitter 和 facebook 等社交网站一样,大数据管理是通过 hadoop 完成的。堆栈溢出是否也能处理如此大量的数据?

索引信息怎么样,redis 是 stackoverflow 解决方案的一部分吗?

了解在世界最流行的技术论坛上部署的解决方案将非常有趣。

最佳答案

本文简要介绍了 2011 年 3 月左右的 stackoverflow 架构:http://highscalability.com/blog/2011/3/3/stack-overflow-architecture-update-now-at-95-million-page-vi.html

在高层次上,它是一个 .NET 应用程序,它使用 MS SQL 服务器作为数据库,Redis 用于缓存,HAProxy 用于负载平衡,以及一整套工具并托管在 Windows 服务器和 Linux 服务器(ubuntu + centos)上).

在那篇文章发表时,他们似乎没有使用任何 hadoop,但这可能已经改变了。他们也可能正在为 map/reduce 类型的工作做一些不同的/定制的事情,或者可能根本不需要这样的事情。凭借精巧,SQL 服务器可以扩展得相当远,而无需依赖“大数据”玩具。如果您可以从缓存层获取大部分数据,则尤其如此。

关于hadoop - 了解 stackoverflow 底层软件基础设施,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20963555/

34 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com