- mongodb - 在 MongoDB mapreduce 中,如何展平值对象?
- javascript - 对象传播与 Object.assign
- html - 输入类型 ="submit"Vs 按钮标签它们可以互换吗?
- sql - 使用 MongoDB 而不是 MS SQL Server 的优缺点
我是 mongodb 的新手,我在 DB Schema 设计方面面临两难:
我应该创建一个集合还是将我的数据放入多个集合中(我想我们可以称之为这些类别)。
现在我知道有人问过很多这样的问题,但我相信我的情况有所不同,原因有两个:
所以我的问题是:这 120 个集合能否提高查询性能?在我的情况下,这是一个有用的优化吗?
或者我应该只使用单个集合 + 分片?
每个集合都应包含数百万个文档。如果只使用一个,它将存储数十亿个文档。
提前致谢!
------- 编辑:
感谢您的精彩回答。
事实上,120 个集合只是一个自制的限制,并不是真正的最优:
集合中的数据与网络发布者有关。可能有数百万个(任何网站都可以加入)。
我想理想的情况是我可以为每个发布者创建一个集合(仅保存他们的数据)。但显然,由于 mongo 的限制,这是不可能的。
所以我想出了固定数量的集合的想法,以至少以某种方式分发数据。比如:集合“A_XX”将保存名称以“A”开头的发布者的 XX 平台相关数据。等等。我们只支持其中的几个平台,所以 120 个集合应该绰绰有余。
在另一个网站上,有人建议使用多个数据库而不是多个集合。但这意味着开销,然后我将不得不使用/管理许多不同的连接。
您对此有何看法?有更好的解决方案吗?
抱歉,我最初的问题不够具体。
提前致谢
最佳答案
问题的编辑版本使实际要求更加清晰:您有一个可能会变得非常大的集合,并且您想要一种对数据进行分区的方法。人工收集限制是你自己规划的分区方案。
在这种情况下,我认为您最好使用单个集合并利用 MongoDB 的 auto-sharding根据需要将数据和工作负载分配到多个服务器的功能。多个集合仍然是一种有效的方法,但与利用核心 MongoDB 功能相比,它会使您的应用程序代码和部署变得不必要地复杂化。假设你 choose a good shard key ,您的数据将在您的分片之间自动平衡。
您不必立即分片;您可以推迟决定,直到您看到您的工作负载实际上需要更多的写入规模(但知道在需要时可以选择该选项)。在决定分片之前,您还有其他选择,例如升级您的服务器(尤其是磁盘和内存)以更好地支持您的工作负载。相反,您不想等到系统被工作负载压垮后再进行分片,因此您肯定需要监控增长。我建议使用免费的MongoDB Monitoring Service (MMS)由 10gen 提供。
On another website someone suggested using many databases instead of many collections. But this means overhead and then I would have to use / manage many different connections.
多个数据库会显着增加管理开销,并且可能会过度杀伤力,并且可能对您的用例有害。存储是在数据库级别分配的,因此 120 个数据库将比具有 120 个集合的单个数据库消耗更多的空间。
如果您可以计划固定数量的集合(根据您的原始问题描述为 120 个),我认为采用这种方法比使用单一集合更有意义。
注意:下面的设计注意事项仍然适用,但由于更新了问题以阐明多个集合是一种尝试的分区方案,因此对单个集合进行分片将是一种更直接的方法。
使用单独集合的动机是:
您的单个大型集合的文档可能必须包含一些集合子类型的指示,这可能需要添加到多个索引中,并且可能会显着增加索引大小。对于单独的集合,子类型已经隐含在集合命名空间中。
在集合级别启用分片。单个大型集合只为您提供“全有或全无”的方法,而单个集合允许您控制需要分片的数据子集并选择更合适的分片键。
您可以使用 compact
命令对单个集合进行碎片整理。 注意: compact
是一种阻塞操作,因此对于 HA 生产环境的正常建议是部署副本集并使用滚动维护(即先压缩辅助节点,然后降级并压缩主节点)。
MongoDB 2.4(和 2.2)目前具有数据库级别的写锁粒度。在实践中,这对于绝大多数用例来说都不是问题,但是如果需要,多个集合可以让您更轻松地将高事件集合移动到单独的数据库中。
进一步说……如果您将数据放在单独的集合中,这些将能够利用 future 对集合级锁定的改进(参见 MongoDB Jira 问题跟踪器中的 SERVER-1240)。
关于mongodb - 120 个 mongodb 集合与单个集合 - 哪个更有效?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16099058/
我已经在 kubernetes 中部署了一个 3 pod mongodb statefulset,并且我正在尝试使用新的 mongodb+srv 连接字符串 (mongodb 3.6) 连接到具有 S
我已经创建了 MongoDB Atlas 帐户,并尝试连接。但出现以下错误。 MongoDB 连接错误 MongoNetworkError: 首次连接时无法连接到服务器 [cluster0-shard
我正在使用 Node-WebKit 创建桌面应用程序。该应用程序基本上是创建文档(员工日常工作的详细信息),任何注册用户都可以对这些文档发表评论。我正在创建的文档将被分成几个部分。用户将对特定部分发表
我正在尝试使用官方网站上的安装程序在我的本地机器上安装 mongo DB。但是我不断收到这条消息,有人可以帮忙吗? 我试过提供的解决方案 here但没有帮助。 最佳答案 我建议执行以下操作: 按 Wi
我对 MongoDB 和 MongoDB Compass 非常陌生。 我的客户集合中有大约 1000 条记录。如何通过 MongoDB 指南针一次删除所有记录。 非常感谢, 最佳答案 您可以使用 Mo
当我尝试在我的 Ubuntu 机器中安装 mongodb 时,apt-get 会显示以下选项 mongodb mongodb-clients mongodb-dev mongodb-server 谁能
如何将 Robomongo(或任何其他 mongodb 客户端)连接到由本地 Meteor 应用程序创建的 mongodb 实例? 最佳答案 确保 Meteor 正在本地主机上运行。打开终端窗口并运行
我需要在 MongoDB 中生成一个简单的频率表。假设我在名为 books 的集合中有以下文档。 { "_id": 1, genre: [ "Fantasy", "Crime"
我如何在 mongos mapreduce 中指定一个条件,就像我们在 mongos group 函数中所做的那样。 我的数据是这样的 {lid:1000, age:23}, {lid:3000, a
我的 mongodb 数据库文档中有几个 ID。我需要通过脚本在这些 ID 上创建索引,这样我就不必一次又一次地运行 ensureIndex 命令。 db.getCollection("element
在我的数据库中,每个包含项目的文档中都有一个嵌套的元素数组,格式如下: elements:[ { "elem_id": 12, items: [ {"i_id": 1
我正在构建一个应用程序,其中用户可以位于不同的时区,并且我运行的查询对他们的时区很敏感。 我遇到的问题是 MongoDB 似乎在查询时忽略了时区! 这是日期字段“2019-09-29T23:52:13
我正在研究使用 mongodb 进行分片,我有以下结构: 1 个 Mongod 到我的 ConfigServer,在 ReplicaSet 中只有 1 个成员 2 个分片,每个分片在 ReplicaS
我正在尝试获取一个 mongoDB 对象,例如 Friend1 包含另一个 mongoDB 对象 Friend2,该对象又包含第一个对象 Friend1本质上使它成为一个循环对象引用。 要么这样,要么
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题? Update the question所以它是on-topic对于堆栈溢出。 9年前关闭。 Improve this que
Mongo 版本 5.0.2。 Ubuntu 20.0 我在本地主机中启用了 MongoDB 连接的安全性。 我正在尝试通过以下命令使用身份验证详细信息连接我的本地主机 MongoDBmongo ad
我即将将分片的 MongoDB 环境从 2.0.7 升级到 2.2.9,最终我想升级到 2.4.9,但显然我需要通过 2.2 来完成。 2.2 的发行说明声明配置服务器应该首先升级其二进制文件,然后是
目前,我无法在我的虚拟 Ubuntu 机器上远程连接 mongodb 服务器。我无法使用在我的 Windows PC 上运行的 Robomongo 客户端连接,该 PC 也运行 vm。 这是两台电脑的
我创建了一个免费的 mongodb 集群。我创建了一个用户,设置了与 mongodb compass 的连接,复制了连接字符串,然后打开了我的 mongodb compass。将复制的字符串粘贴到那里
我使用 java 代码创建了 mongo 数据库集合索引 dbCollection.createIndex("accountNumber"); 当我看到索引使用 db.accounts.getInde
我是一名优秀的程序员,十分优秀!