node.js - Mongodb 基于具有计数的唯一子集合属性聚合搜索结果？-6ren

node.js - Mongodb 基于具有计数的唯一子集合属性聚合搜索结果？

转载作者：可可西里更新时间：2023-11-01 09:47:32

25

4

几个小时以来，我一直在努力思考如何做到这一点，我有一个名为“Jobs”的集合——在内部，它们有一个子集合“Site”，即 Jobs.site。此站点子集合具有属性“UNID”。

我正在尝试基于文本搜索从数据库中检索文档，效果很好。

但我试图仅检索基于该 Job.Site.UNID 的 UNIQUE 文档，并且可能添加了一个计数作为额外属性。结果应如下所示:

工作:{ 站点:{ field1:'EXAMPLE'，UNID:'SITEID'，计数:5 }}

这意味着作业集合中有 5 个作业具有该 site.UNID。

这是我目前所拥有的:

[
// GETTING DOCS BASED ON TEXT SEARCH RESULTS
    {
      $match: {
        // clientId: req.user.client_id,
        $text: { $search: body.searchTerms }
      }
    },
// SORTING THEM BASED ON TEXTSCORE
    { $sort: { score: { $meta: 'textScore' } } },
// THE PROBLEMATIC GROUPING PART
    { $group: { site: { UPRN: '$UPRN', myCount: { $sum: 1 } } } },
// I ONYL WANT TO GET 20 DOCS AT A TIME
    { $limit: 20 },
// THE DATA THAT I WANT IN MY DOCUMENTS, MAYBE COUNT WOULD COME HERE?
    {
      $project: {
        site: true,
        score: { $meta: 'textScore' }
      }
    },
// GETTING RID OF POOR MATCHES BASED ON A SCORE CALCULATED IN ANOTHER 
// FUNCTION BASED ON THE NUMBER OF WORDS IN THE TEXT SEARCH
    {
      $match: {
        score: { $gt: matchScore }
      }
    }
  ]

这里让我印象深刻的是 The field 'site' must be an accumulator object

所以我想不出正确处理该子集合属性的语法。

编辑:感谢@Anthony，V2 完美地工作并且已经对其进行了彻底的测试，除了它似乎没有计算工作总数，它总是 1 或我在 $sum 中设置的任何值:但是有 200 多个结果，仍在工作在上面。

 { $match: { $text: { $search: body.searchTerms } } },
    { $sort: { $score: { $meta: 'textScore' } } },
    // { $match: { score: { $gt: 0.1 } } },
    {
      $group: {
        _id: '$UNID',
        counter: { $sum: 1 },
        score: { $first: { $meta: 'textScore' } },
        title: { $first: '$title' },
        postcode: { $first: '$postcode' },
        addressLine1: { $first: '$addressLine1' },
        city: { $first: '$city' },
        projectName: { $first: '$projectName' },
        jobsCount: { $sum: '$counter' }
      }
    },
    { $limit: 20 },
    {
      $project: {
        UNID: '$_id',
        title: '$title',
        postcode: '$postcode',
        addressLine1: '$addressLine1',
        projectName: '$projectName',
        city: '$city',
        score: 1,
        jobsCount: true
      }
    }

示例数据:


{
  "_id": "randomString0",
  "title": "Quality",
  "site": {
    "_id": "rKFRbvH8CEbJYdzDs",
    "title": "Title 1",
    "addressLine1": "address1",
    "UNID": "001",
    "city": "cityName",
    "createdAt": null
  }
},
{
  "_id": "randomString1",
  "title": "Some2123",
  "site": {
    "_id": "rKFRbvH8CEbJYdzDs",
    "title": "Title 1",
    "addressLine1": "address1",
    "UNID": "001",
    "city": "cityName",
    "createdAt": null
  }
},
{
  "_id": "randomString2",
  "title": "Random title",
  "site": {
    "_id": "rKFRbvH8CEbJYdzDs",
    "title": "Title 1",
    "addressLine1": "address1",
    "UNID": "001",
    "city": "cityName",
    "createdAt": null
  }
},
{
  "_id": "randomString3",
  "title": "Another unique job",
  "site": {
    "_id": "rKFRbvH8CEbJYdzDs",
    "title": "Title 1",
    "addressLine1": "address1",
    "UNID": "001",
    "city": "cityName",
    "createdAt": null
  }
},
{
  "_id": "randomString4",
  "title": "Other thing",
  "site": {
    "_id": "rKFRbvH8CEbJYdzDs",
    "title": "Title 1",
    "addressLine1": "address1",
    "UNID": "001",
    "city": "cityName",
    "createdAt": null
  }
},
{
  "_id": "randomString5",
  "title": "Something else",
  "site": {
    "_id": "rKFRbvH8CEbJYdzDs",
    "title": "Title 1",
    "addressLine1": "address1",
    "UNID": "001",
    "city": "cityName",
    "createdAt": null
  }
}

如您所见，站点数据在所有这 5 个文档下始终是唯一的，但是计数器应该计算有多少文档具有相同的唯一性

最佳答案

在$group暂存 _id(您要分组的依据)表达式是必需的表达式。而且只有少数accumulators你可以使用 $group聚合阶段。

所以你的聚合一定是这样的

[
  { "$match": { "$text": { "$search": body.searchTerms }}},
  { "$sort": { "score": { "$meta": "textScore" } } },
  { "$match": { "score": { "$gt": matchScore }}},
  { "$group": {
    "_id": "$UPRN",
    "myCount": { "$sum": 1 },
    "score": { "$first": "$score" }
  }},
  { "$limit": 20 },
  { "$project": {
    "site": "$_id",
    "score": 1,
    "myCount": 1
  }}
]

关于node.js - Mongodb 基于具有计数的唯一子集合属性聚合搜索结果？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/55636225/

25

4

0

文章推荐： android - 检查 WebView 元素时出现 UiAutomator 错误

文章推荐： windows - 以编程方式将 SAS 用户踢出

文章推荐： java - JAVA_HOME 环境变量有什么意义

文章推荐： android - 使用 Facebook SDK 的 NullPointer

mongodb - 使用 mongodb+srv 连接到部署为有状态集的 mongodb
我已经在 kubernetes 中部署了一个 3 pod mongodb statefulset，并且我正在尝试使用新的 mongodb+srv 连接字符串 (mongodb 3.6) 连接到具有 S
mongodb - 如何使用 MongoDB Atlas 连接 MongoDB
我已经创建了 MongoDB Atlas 帐户，并尝试连接。但出现以下错误。 MongoDB 连接错误 MongoNetworkError: 首次连接时无法连接到服务器 [cluster0-shard
mongodb - JsonLD+MongoDB : Store JsonLD in MongoDB
我正在使用 Node-WebKit 创建桌面应用程序。该应用程序基本上是创建文档(员工日常工作的详细信息)，任何注册用户都可以对这些文档发表评论。我正在创建的文档将被分成几个部分。用户将对特定部分发表
mongodb - 服务 'MongoDB Server' (MongoDB) 启动失败
我正在尝试使用官方网站上的安装程序在我的本地机器上安装 mongo DB。但是我不断收到这条消息，有人可以帮忙吗？我试过提供的解决方案 here但没有帮助。最佳答案我建议执行以下操作: 按 Wi
mongodb - 如何使用 MongoDB 指南针删除 MongoDB 集合中选定的多条记录
我对 MongoDB 和 MongoDB Compass 非常陌生。我的客户集合中有大约 1000 条记录。如何通过 MongoDB 指南针一次删除所有记录。非常感谢，最佳答案您可以使用 Mo
mongodb - mongodb 和 mongodb-server 的区别
当我尝试在我的 Ubuntu 机器中安装 mongodb 时，apt-get 会显示以下选项 mongodb mongodb-clients mongodb-dev mongodb-server 谁能
mongodb - 如何将 mongodb 客户端连接到本地 Meteor MongoDB
如何将 Robomongo(或任何其他 mongodb 客户端)连接到由本地 Meteor 应用程序创建的 mongodb 实例？最佳答案确保 Meteor 正在本地主机上运行。打开终端窗口并运行
mongodb - 频率表生成 - MongoDB
我需要在 MongoDB 中生成一个简单的频率表。假设我在名为 books 的集合中有以下文档。 { "_id": 1, genre: [ "Fantasy", "Crime"
mongodb - mongodb mapreduce中的where条件
我如何在 mongos mapreduce 中指定一个条件，就像我们在 mongos group 函数中所做的那样。我的数据是这样的 {lid:1000, age:23}, {lid:3000, a
mongodb - 从 mongodb shell 运行具有 mongodb 查询的脚本
我的 mongodb 数据库文档中有几个 ID。我需要通过脚本在这些 ID 上创建索引，这样我就不必一次又一次地运行 ensureIndex 命令。 db.getCollection("element
mongodb - 比较嵌套数组中的对象 - mongoDB
在我的数据库中，每个包含项目的文档中都有一个嵌套的元素数组，格式如下: elements:[ { "elem_id": 12, items: [ {"i_id": 1
mongodb - MongoDB 上的时区查询
我正在构建一个应用程序，其中用户可以位于不同的时区，并且我运行的查询对他们的时区很敏感。我遇到的问题是 MongoDB 似乎在查询时忽略了时区! 这是日期字段“2019-09-29T23:52:13
mongodb - 为什么当我添加新集合时只有一个分片获取数据？ - MongoDB
我正在研究使用 mongodb 进行分片，我有以下结构: 1 个 Mongod 到我的 ConfigServer，在 ReplicaSet 中只有 1 个成员 2 个分片，每个分片在 ReplicaS
mongodb - mongoDB 中是否可以使用循环对象引用？
我正在尝试获取一个 mongoDB 对象，例如 Friend1 包含另一个 mongoDB 对象 Friend2，该对象又包含第一个对象 Friend1本质上使它成为一个循环对象引用。要么这样，要么
mongodb - 通过命令行正确卸载 MongoDB
关闭。这个问题是off-topic .它目前不接受答案。想改进这个问题？ Update the question所以它是on-topic对于堆栈溢出。 9年前关闭。 Improve this que
mongodb - 无法通过终端使用身份验证数据连接 mongodb
Mongo 版本 5.0.2。 Ubuntu 20.0 我在本地主机中启用了 MongoDB 连接的安全性。我正在尝试通过以下命令使用身份验证详细信息连接我的本地主机 MongoDBmongo ad
mongodb - 当配置实例使用与数据实例相同的二进制文件时升级 Mongodb
我即将将分片的 MongoDB 环境从 2.0.7 升级到 2.2.9，最终我想升级到 2.4.9，但显然我需要通过 2.2 来完成。 2.2 的发行说明声明配置服务器应该首先升级其二进制文件，然后是
mongodb - 无法远程连接到 mongodb
目前，我无法在我的虚拟 Ubuntu 机器上远程连接 mongodb 服务器。我无法使用在我的 Windows PC 上运行的 Robomongo 客户端连接，该 PC 也运行 vm。这是两台电脑的
mongodb - 如何从 mongodb compass 连接 mongodb 集群？
我创建了一个免费的 mongodb 集群。我创建了一个用户，设置了与 mongodb compass 的连接，复制了连接字符串，然后打开了我的 mongodb compass。将复制的字符串粘贴到那里
mongodb - MongoDB 索引名称
我使用 java 代码创建了 mongo 数据库集合索引 dbCollection.createIndex("accountNumber"); 当我看到索引使用 db.accounts.getInde

首页

博学

6Ren·AI

商城

node.js - Mongodb 基于具有计数的唯一子集合属性聚合搜索结果？