gpt4 book ai didi

node.js - 返回重复结果的 Mongoose 查询

转载 作者:可可西里 更新时间:2023-11-01 09:13:34 25 4
gpt4 key购买 nike

查询接收一对坐标、最大距离半径、一个“跳过”整数和一个“限制”整数。该函数应根据给定的位置返回最近和最新的位置。我的代码中没有明显的错误,但是,当我再次调用查询时,它会返回重复的结果。 “skip”变量根据返回的结果进行更新。

例子:

1) 我使用 skip = 0,limit = 10 进行查询。我收到 10 个非重复位置。

2) 现在再次调用查询,skip = 10,limit = 10。我收到另外 10 个位置,其中包含第一个查询的重复结果。

查询

Locations.find({ coordinates :
{ $near : [ x , y ],
$maxDistance: maxDistance }
})
.sort('date_created')
.skip(skip)
.limit(limit)
.exec(function(err, locations) {
console.log("[+]Found Locations");
callback(locations);
});

架构

var locationSchema = new Schema({
date_created: { type: Date },
coordinates: [],
text: { type: String }
});

我试过到处寻找解决方案。我唯一的选择是 Mongo 版本?我使用 mongoose 4.x.x,而 mongodb 就像 2.5.6。我相信。有任何想法吗?

最佳答案

对于您想要的结果排序,这里有几件事需要考虑,首先要考虑的是您在“date_created”中有一个“次要”排序标准要处理。

基本问题是 $near MongoDB 中的运算符和类似运算符目前不“转换”任何字段来指示与查询位置的“距离”,而只是对数据进行“默认排序”。因此,为了进行“次要”排序,需要存在具有“距离”的字段。因此,还有其他选择。

第二种情况是“跳过”和“限制”样式的分页在大数据集上的表现很糟糕,应该尽可能避免。因此,最好根据数据出现的“范围”选择数据,而不是“跳过”之前显示的所有结果。

这里要做的第一件事是使用可以将距离连同其他信息“转换”到文档中的命令。 $geoNear的聚合命令对此有好处,尤其是因为我们想进行其他排序:

var seenIds = [],
lastDistance = null,
lastDate = null;

Locations.aggregate(
[
{ "$geoNear": {
"near": [x,y],
"maxDistance": maxDistance
"distanceField": "dist",
"limit": 10
}},
{ "$sort": { "dist": 1, "date_created": -1 }
],
function(err,results) {
results.forEach(function(result) {

if ( ( result.dist != lastDistance ) || ( result.date_created != lastDate ) ) {
seenIds = [];
lastDistance = result.dist;
lastDate = result.date_created;
}
seenIds.push(result._id);
});
// save those variables to session or other persistence
// do something with results
}
)

这是您获取前 10 个结果的第一次迭代。注意循环内的逻辑,其中检查结果中的每个文档是否有“date_created”或“dist”字段中的更改出现在文档中并且出现这种情况时,“seenIds”数组将删除所有当前条目。一般的操作是所有变量都经过测试,并可能在每次迭代时更新,如果没有变化,则将项目添加到“seenIds”列表中。

所有这三个正在处理的变量都需要存储在某个地方等待下一个请求。对于 Web 应用程序, session 存储是理想的,但不同的方法会有所不同。您只希望在我们开始下一个请求时重新调用这些值,因为在下一次和后续迭代中我们稍微改变了查询:

Locations.aggregate(
[
{ "$geoNear": {
"near": [x,y],
"maxDistance": maxDistance,
"minDistance": lastDistance,
"distanceField": "dist",
"limit": 10,
"query": {
"_id": { "$nin": seenIds },
"date_created": { "$lt": lastDate }
}
}},
{ "$sort": { "dist": 1, "date_created": -1 }
],
function(err,results) {
results.forEach(function(result) {
if ( ( result.dist != lastDistance ) || ( result.date_created != lastDate ) ) {
seenIds = [];
lastDistance = result.dist;
lastDate = result.date_created;
}
seenIds.push(result._id);
});
// save those variables to session or other persistence
// do something with results
}
)

所以输入了“minDistance”参数,因为你想排除任何已经看到的“更接近”的结果,并且额外的检查被放置在查询中,“date_created”需要“小于"也记录了“lastDistance”,因为我们按降序排序,最后的“sure”过滤器排除了列表中记录的任何“_id”值,因为值没有改变。

现在,对于地理空间数据,“seenIds”列表不太可能增长,因为通常您不会在相同的距离内找到所有东西,但这是一个像这样对排序的数据列表进行分页的一般过程,所以它值得理解这个概念。

因此,如果您希望能够使用辅助字段对地理空间数据进行排序并考虑“近”距离,那么这是一般方法,通过将距离值投影到文档结果中并存储在任何不会使它们唯一的更改之前最后一次看到的值。

一般概念是“推进最小距离”,使每页结果逐渐“远离”查询中使用的源点。

关于node.js - 返回重复结果的 Mongoose 查询,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32512959/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com