mongodb - 当嵌入不是答案时如何处理MongoDB中的多对多关系？-6ren

mongodb - 当嵌入不是答案时如何处理MongoDB中的多对多关系？

转载作者：IT老高更新时间：2023-10-28 13:28:20

26

4

这是交易。假设我们在 MongoDB 中有以下数据模式:

items :包含一些数据的大型文档的集合(它实际上是什么绝对无关紧要)。

item_groups :包含文档的集合，其中包含 items._id 的列表叫 item_groups.items加上一些额外的数据。

因此，这两者通过多对多关系联系在一起。但是有一件棘手的事情:由于某种原因，我无法将项目存储在项目组中，因此——正如标题所说——嵌入不是答案。

我真正担心的查询旨在查找包含某些特定项目的某些特定组(即，我为每个集合设置了一组标准)。事实上，它还必须说明每个找到的组中有多少项目符合标准(没有项目意味着未找到该组)。

到目前为止，我想出的唯一可行的解决方案是使用 Map/Reduce 方法和一个虚拟的 reduce 函数:

function map () {
    // imagine that item_criteria came from the scope.
    // it's a mongodb query object.
    item_criteria._id = {$in: this.items};
    var group_size = db.items.count(item_criteria);
    // this group holds no relevant items, skip it
    if (group_size == 0) return;

    var key = this._id.str;
    var value = {size: group_size, ...};

    emit(key, value);
}

function reduce (key, values) {
    // since the map function emits each group just once,
    // values will always be a list with length=1
    return values[0];
}

db.runCommand({
    mapreduce: item_groups,
    map: map,
    reduce: reduce,
    query: item_groups_criteria,
    scope: {item_criteria: item_criteria},
});

问题线是:

item_criteria._id = {$in: this.items};

如果 this.items.length == 5000 甚至更多怎么办？我的 RDBMS 背景大声呼喊:

SELECT ... FROM ... WHERE whatever_id IN (over 9000 comma-separated IDs)

绝对不是好去处 .

非常感谢你们的时间，伙计们!

我希望最好的答案是“你太蠢了，不要用 RDBMS 风格思考，使用 $its_a_kind_of_magicSphere 来自 MongoDB 的最新版本”:)

最佳答案

我认为您正在努力将域/对象建模与数据库模式建模分开。在尝试 MongoDb 时，我也为此苦苦挣扎。

为了语义和清晰起见，我将替换 Groups带字Categories
本质上，您的理论模型是“多对多”关系，其中每个 Item可以属于Categories , 和每个 Category然后可以拥有很多Items .

这最好在域对象建模中处理，而不是在 DB 模式中处理，尤其是在实现文档数据库 (NoSQL) 时。在您的 MongoDb 模式中，您通过使用顶级文档模型和嵌入的组合来“伪造”“多对多”关系。

对于来自 SQL 持久性后端的人来说，嵌入很难接受，但它是答案的重要组成部分。诀窍是决定它是浅还是深，单向还是双向等。

顶级文档模型

因为您的 Category文档包含自己的一些数据，并被大量 Items 大量引用。，我同意你的观点，将它们完全嵌入每个 Item是不明智的。

相反，同时对待 Item和 Category对象作为顶级文档。确保您的 MongoDb 模式为每个文件分配一个表，以便每个文档都有自己的 ObjectId .

下一步是决定嵌入的位置和数量……没有正确的答案，因为这完全取决于您如何使用它以及您的扩展目标是什么……

嵌入决策

1. 元素

至少，您的 Item对象应该具有其类别的集合属性。至少这个集合应该包含 ObjectId每个Category .

我的建议是将您与 Item 交互时使用的数据添加到此集合中。最经常...

例如，如果我想在我的网页上以网格形式列出一堆项目，并显示它们所属类别的名称。很明显，我不需要了解有关 Category 的所有信息。，但如果我只嵌入了 ObjectId，则需要第二个查询来获取有关它的任何详细信息。

相反，最有意义的是嵌入类别的 Name收藏中的属性(property)以及 ObjectId ，以便拉回 Item现在无需其他查询即可显示其类别名称。

要记住的最重要的事情是嵌入在您的 Item 中的键/值对象。 “代表”一个 Category不一定要匹配真实Category文档模型...它不是面向对象编程或关系数据库建模。

2. 分类

相反，您可能会选择单向嵌入，而没有任何 Item您的 Category 中的信息文档...或者您可以选择像上面一样为项目数据添加一个集合( ObjectId ，或 ObjectId + Name )...

在这个方向上，我个人倾向于不嵌入任何东西......如果我想要的话，很有可能Item我的类别的信息，我想要很多，而不仅仅是一个名称......并且深入嵌入顶级文档(项目)是没有意义的。我只会让自己查询数据库中的 Items 集合，其中每个集合都在其类别集合中拥有我的类别的 ObjectId。

呼......肯定令人困惑。关键是，您将有一些数据重复，并且必须根据使用情况调整模型以获得最佳性能。好消息是这正是 MongoDb 和其他文档数据库所擅长的……

关于mongodb - 当嵌入不是答案时如何处理MongoDB中的多对多关系？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/6990166/

26

4

0

文章推荐： MongoDB不区分大小写的键搜索

文章推荐： MongoDB:使用嵌入式对象的好处

mongodb - 使用 mongodb+srv 连接到部署为有状态集的 mongodb
我已经在 kubernetes 中部署了一个 3 pod mongodb statefulset，并且我正在尝试使用新的 mongodb+srv 连接字符串 (mongodb 3.6) 连接到具有 S
mongodb - 如何使用 MongoDB Atlas 连接 MongoDB
我已经创建了 MongoDB Atlas 帐户，并尝试连接。但出现以下错误。 MongoDB 连接错误 MongoNetworkError: 首次连接时无法连接到服务器 [cluster0-shard
mongodb - JsonLD+MongoDB : Store JsonLD in MongoDB
我正在使用 Node-WebKit 创建桌面应用程序。该应用程序基本上是创建文档(员工日常工作的详细信息)，任何注册用户都可以对这些文档发表评论。我正在创建的文档将被分成几个部分。用户将对特定部分发表
mongodb - 服务 'MongoDB Server' (MongoDB) 启动失败
我正在尝试使用官方网站上的安装程序在我的本地机器上安装 mongo DB。但是我不断收到这条消息，有人可以帮忙吗？我试过提供的解决方案 here但没有帮助。最佳答案我建议执行以下操作: 按 Wi
mongodb - 如何使用 MongoDB 指南针删除 MongoDB 集合中选定的多条记录
我对 MongoDB 和 MongoDB Compass 非常陌生。我的客户集合中有大约 1000 条记录。如何通过 MongoDB 指南针一次删除所有记录。非常感谢，最佳答案您可以使用 Mo
mongodb - mongodb 和 mongodb-server 的区别
当我尝试在我的 Ubuntu 机器中安装 mongodb 时，apt-get 会显示以下选项 mongodb mongodb-clients mongodb-dev mongodb-server 谁能
mongodb - 如何将 mongodb 客户端连接到本地 Meteor MongoDB
如何将 Robomongo(或任何其他 mongodb 客户端)连接到由本地 Meteor 应用程序创建的 mongodb 实例？最佳答案确保 Meteor 正在本地主机上运行。打开终端窗口并运行
mongodb - 频率表生成 - MongoDB
我需要在 MongoDB 中生成一个简单的频率表。假设我在名为 books 的集合中有以下文档。 { "_id": 1, genre: [ "Fantasy", "Crime"
mongodb - mongodb mapreduce中的where条件
我如何在 mongos mapreduce 中指定一个条件，就像我们在 mongos group 函数中所做的那样。我的数据是这样的 {lid:1000, age:23}, {lid:3000, a
mongodb - 从 mongodb shell 运行具有 mongodb 查询的脚本
我的 mongodb 数据库文档中有几个 ID。我需要通过脚本在这些 ID 上创建索引，这样我就不必一次又一次地运行 ensureIndex 命令。 db.getCollection("element
mongodb - 比较嵌套数组中的对象 - mongoDB
在我的数据库中，每个包含项目的文档中都有一个嵌套的元素数组，格式如下: elements:[ { "elem_id": 12, items: [ {"i_id": 1
mongodb - MongoDB 上的时区查询
我正在构建一个应用程序，其中用户可以位于不同的时区，并且我运行的查询对他们的时区很敏感。我遇到的问题是 MongoDB 似乎在查询时忽略了时区! 这是日期字段“2019-09-29T23:52:13
mongodb - 为什么当我添加新集合时只有一个分片获取数据？ - MongoDB
我正在研究使用 mongodb 进行分片，我有以下结构: 1 个 Mongod 到我的 ConfigServer，在 ReplicaSet 中只有 1 个成员 2 个分片，每个分片在 ReplicaS
mongodb - mongoDB 中是否可以使用循环对象引用？
我正在尝试获取一个 mongoDB 对象，例如 Friend1 包含另一个 mongoDB 对象 Friend2，该对象又包含第一个对象 Friend1本质上使它成为一个循环对象引用。要么这样，要么
mongodb - 通过命令行正确卸载 MongoDB
关闭。这个问题是off-topic .它目前不接受答案。想改进这个问题？ Update the question所以它是on-topic对于堆栈溢出。 9年前关闭。 Improve this que
mongodb - 无法通过终端使用身份验证数据连接 mongodb
Mongo 版本 5.0.2。 Ubuntu 20.0 我在本地主机中启用了 MongoDB 连接的安全性。我正在尝试通过以下命令使用身份验证详细信息连接我的本地主机 MongoDBmongo ad
mongodb - 当配置实例使用与数据实例相同的二进制文件时升级 Mongodb
我即将将分片的 MongoDB 环境从 2.0.7 升级到 2.2.9，最终我想升级到 2.4.9，但显然我需要通过 2.2 来完成。 2.2 的发行说明声明配置服务器应该首先升级其二进制文件，然后是
mongodb - 无法远程连接到 mongodb
目前，我无法在我的虚拟 Ubuntu 机器上远程连接 mongodb 服务器。我无法使用在我的 Windows PC 上运行的 Robomongo 客户端连接，该 PC 也运行 vm。这是两台电脑的
mongodb - 如何从 mongodb compass 连接 mongodb 集群？
我创建了一个免费的 mongodb 集群。我创建了一个用户，设置了与 mongodb compass 的连接，复制了连接字符串，然后打开了我的 mongodb compass。将复制的字符串粘贴到那里
mongodb - MongoDB 索引名称
我使用 java 代码创建了 mongo 数据库集合索引 dbCollection.createIndex("accountNumber"); 当我看到索引使用 db.accounts.getInde

首页

博学

6Ren·AI

商城

mongodb - 当嵌入不是答案时如何处理MongoDB中的多对多关系？