- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
我一直在尝试了解有关分布式系统中数据库扩展的更多信息,但我陷入了 RDBMS 和 NoSQL 之间。
一些在线文章表明 NoSQL 是现代大数据的解决方案。其他人则说 NoSQL 只是一种炒作,RDBMS 可以通过良好的设计进行扩展,并提供良好的数据结构。
与其阅读其他人的意见,我更愿意自己判断这两者,但我不明白可伸缩 RDBMS 和可伸缩 NoSQL 到底需要什么。
我阅读了更多有关 RDBMS 的资料,看来该解决方案需要利用内存缓存和分片来减少数据库大小和数据库查询的数量。还有其他技巧吗?你还能使用有很多列的表格吗?或者使用更少的列和更多的连接?
至于 NoSQL,我读过一些有关 MongoDB 的资料。我知道它鼓励数据聚合。但这如何使其更具可扩展性?我也开始学习 Cassandra,因为我读到它的扩展性比 MongoDB 好得多,但我不知道它的可扩展性如何。
我非常感谢关于扩展 RDBMS 和 NoSQL 的基本(或高级,如果您有耐心输入)简明和深入核心的解释,或解释该主题的在线好文章或书籍. :)
最佳答案
我不会介绍您可以通过自己实现并在两者之间放置一个内存缓存服务器来扩展的方法,...我将只介绍开箱即用的内容...
让我们先从RDBMS开始:
我认为设置 RDBMS 集群比 NoSQL 集群更复杂,但这只是我的看法。通常你拥有的是一个 Master 和多个 Slave。您必须将所有写入发送给主机,并且可以从您想要的任何从机读取。由于您拥有 RDBMS 和 ACID,系统应该以某种方式向您保证您不会读取旧数据。所以这里的问题是,您假设您的应用程序写入一次并经常读取(通常是这种情况)。出于这些目的,一台服务器用于读/写和多台服务器用于读是很好的。问题是,如果您的写入过于频繁,以至于您无法再在一台机器上跟上它们。那是你的瓶颈。例如,除了来自 Oracle 的内置解决方案——它们非常庞大——还有 http://www.scalearc.com/它可以缓存查询,...并为您处理缩放。
NoSQL:
没有 1 个 NoSQL 模式被所有的数据库实现。每个系统都有点不同。例如 MongoDB 与 RDBMS 非常相似,它也只有一个 Master 和几个 slave,它可以向其复制数据,但您还可以创建分片。数据在分片之间拆分,并复制到从属。所以你可以有多个不同的主人负责较小的部分。之后当您读取时,您可以选择是否要从多个从属设备、主设备或任何从设备读取 - 这取决于您需要最新数据的紧急程度。
另一方面,Cassandra 的工作方式完全不同。我不确定您是否可以写入多个服务器或它是如何工作的,但基本上服务器会保留所有写入的日志。因此,即使他们不能立即处理写入,它们也会存储在日志中,以便仍然为您提供快速响应。之后你再读的时候,你可以再说一遍你有多迫切想要新的数据,如果你真的想要最新的最新数据,Cassandra 需要检查日志,如果有更新写入,这将花费你一个很多时间。
ElasticSearch、CouchDB、CouchBase 等键值存储的工作方式又有所不同。这里项目的散列,并基于散列,发送到将负责它的一个节点。这样,当您在写入 key 后读取时,您会再次获得最新信息,因为您将从同一个节点读取。这种设计的想法是,没有一个单一的 key 会是每个人都感兴趣的,但负载会被分配。这些也是我认为扩展性最好的数据库,并使向集群添加更多服务器变得最容易,但是你失去了复杂查询的能力,就像你在 MongoDB 和 Cassandra 中拥有它一样——当然还有 RDBMS。 ElasticSearch 有一些简单的搜索查询,而 CouchDB 和 CouchBase 只有 MapReduce 生成的 View ,如果它适合 View ,你可以从中获取你想要的数据。否则您只能通过 key 访问它。
http://kkovacs.eu/cassandra-vs-mongodb-vs-couchdb-vs-redis - 非常全面地总结了最常见的 NoSQL 数据库、它们的优缺点以及最常见的使用场景。
最后,问题也是,为什么要规模化?您将在数据库中拥有多少条记录?几百万根本不是问题。对于足够强大的服务器上的大多数 RDBMS,几亿也不是问题。如果正确设计数据库及其索引,即使每年十亿条记录也应该没问题。
关于database - 可扩展的数据库技术和架构,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23852376/
原谅那个疯狂的标题... 我试图理解面向对象编程中继承与接口(interface)的概念。所以我试图将它与我已经知道的东西联系起来,这就是 CSS。 在 CSS 中,您可以选择在允许元素“继承”样式的
我有一个 C 函数,它返回一个表示二进制数据的 unsigned char*。我在文档中注意到 SWIG 有一个很好的类型映射来处理二进制数据作为 C 函数的输入,但是当 C 函数返回二进制数据及其无
过去遇到过几次类似的问题,想知道用什么语言(方法)来解决类似的问题(我是J2EE/java开发人员): 问题:在一组可能的单词中,根据给定的规则(假设单词可以是 A 和 X 的组合,并且始终以 X 开
这个问题不太可能帮助任何 future 的访客;它只与一个小地理区域、一个特定时刻或一个非常狭窄的情况相关,而这些情况通常不适用于互联网的全局受众。如需帮助使这个问题更广泛地适用,visit the
如果我们已经开发了自己的ORM框架并且该框架在过去的几年中运行良好,那么为什么我们要为即将到来的软件项目学习和使用全新的.net技术,例如LINQ或Entity Framework或NHibernat
即使听起来很奇怪,我相信每个人在处理具有大量自定义组件的大型应用程序时都遇到过此类问题。某个地方生成了 AV,但应用程序仍在继续执行,稍后会出现错误。我不是在谈论多线程应用程序。只是关于通用的单线程应
我正在设计一个新项目,我正在尝试找出将数据/事件从服务器应用程序推送到客户端应用程序(即 WPF 应用程序)的方法。 我知道的两个是: 发布/订阅(即 NServiceBus) Full Duplex
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。 想改善这个问题吗?更新问题,使其成为 on-topic对于堆栈溢出。 5年前关闭。 Improve thi
这个问题在这里已经有了答案: C# .NET: How to check if we're running on battery? (6 个答案) 关闭 9 年前。 我发现许多 API 可以帮助确定
没有 JQUERY!我有一个下拉列表,用户可以在其中选择日期、月份和年份。我创建以下代码并使用 setFullYear 将这些值传递到变量中。有时我还会向这个变量添加天数,这就是变量 ev_num 的
我有一个控件,我想在表单和打印时以不同的方式绘制它。这是我做的方式: private void printDocument1_PrintPage(object sender, System.Drawi
我正在尝试确定从扫描文档中提取手写数据的最佳方法。 手写数据位于特定的方框区域。我生成了文档的数字版本,因此我知道方框区域的坐标,并且如果需要还可以生成文档的其他变体(即被屏蔽以使字段更容易提取的版本
背景 对于基于音乐的问题,我深表歉意,但细节并没有那么重要。我正在按顺序浏览一个 midi 文件,我正在寻找一种有效的方法来查找数据中的模式以找到称为连音符的东西。见下图: 连音符上方有数字(3 或
经验丰富的 Java 新手,寻求您的智慧: 如果无法确保在对象超出范围时执行某些特定的 block 代码,那么还有哪些其他方法可以提供相同的功能?(看起来 finalize 显然不是那个意思) 一个典
我正在玩一个小的油漆应用程序。我想创建不同的画笔提示(不仅仅是简单的线条)。基本思想是沿着鼠标移动重复(冲压)画笔 Nib 。因为鼠标移动不会为鼠标移动的每个像素分派(dispatch)所需的事件。我
我正在制作时间表应用程序。重要的类是: Period id: int clazz: Clazz SubjectTeacher subject: String teac
关闭。这个问题需要更多 focused .它目前不接受答案。 想要改进这个问题吗? 更新问题,使其只关注一个问题 editing this post . 关闭 4 年前。 Improve this q
我有一个奇怪的任务要解决。我们有一个小型视频窗口(如 300x200 像素,256 色调色板)和 44kHz 2ch 声音在服务器上播放。我们需要将此流视频发送给一些客户端(1,2.. 最多 10 个
我很确定我在这里遗漏了一些东西,因为我对 Shapeless 还很陌生并且我正在学习,但是 Aux 技术实际上什么时候开始需要 ?我看到它是用来暴露一个 type通过将其提升为另一个“同伴”的签名来声
微软有什么理由仍然坚持使用 COM 技术(Office 组件仍然是 COM)……当所有用 COM 完成的事情都可以用 .Net 以更好、更有效的方式完成时 最佳答案 因为它需要一个 长完全重写Offi
我是一名优秀的程序员,十分优秀!