- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
如何通过字符串数组排序进行查询,该查询将在其计划中没有 "stage": "SORT"
的情况下执行?
我使用的是 mongo 3.6
“mycoll”集合包含大约 500.000 个文档,如下所示:
{
someobject:{
arrayfield:["asd","qwe"]
}
}
{
someobject:{
arrayfield:["zxc"]
}
}
此查询
db.mycoll.find().sort({ "someobject.arrayfield": 1 }).skip(125340).limit(20)
产生错误
Sort operation used more than the maximum 33554432 bytes of RAM
我在“someobject.arrayfield”上有索引,但是explain()给了我:
"winningPlan" : {
"stage" : "SKIP",
"skipAmount" : 125340,
"inputStage" : {
"stage" : "SORT",
"sortPattern" : {
"someobject.arrayfield" : 1
},
"limitAmount" : 125360,
"inputStage" : {
"stage" : "SORT_KEY_GENERATOR",
"inputStage" : {
"stage" : "FETCH",
"inputStage" : {
"stage" : "IXSCAN",
"keyPattern" : {
"someobject.arrayfield" : 1
},
"indexName" : "arrayfield_indexname",
"isMultiKey" : true,
"multiKeyPaths" : {
"someobject.arrayfield" : [
"someobject.arrayfield"
]
},
"isUnique" : false,
"isSparse" : false,
"isPartial" : false,
"indexVersion" : 2,
"direction" : "forward",
"indexBounds" : {
"someobject.arrayfield" : [
"[MinKey, MaxKey]"
]
}
}
}
}
}
}
我知道,我可以增加限制,使用带有“allowdiskusage”或查询的聚合
db.mycoll.find().sort({ "someobject.arrayfield.1": 1 }).skip(125340).limit(20)
索引位于“someobject.arrayfield.1”
最佳答案
我有一个潜在的解决方案,具体取决于数组中的值实际是什么,以及您是否只需要稳定的排序,或者是否需要基于 mongodb 使用的数组比较逻辑的排序。
如果您不想阅读有关 mongodb 如何比较数组的一些详细信息,请跳到建议的解决方案部分。
<小时/>起初,我很好奇数组字段上的 .sort()
如何对结果进行排序。它会使用第一个数组值进行比较吗?或者这些值的某种组合?
经过一些测试,看起来 mongodb 使用数组中的所有值来比较和排序它们。这是我的测试数据(为简洁起见,省略了 _id
字段):
db.mycoll.find().sort({"someobject.arrayfield":1})
{ "someobject" : { "arrayfield" : [ "rty", "aaa" ] } }
{ "someobject" : { "arrayfield" : [ "xcv", "aaa", "bcd" ] } }
{ "someobject" : { "arrayfield" : [ "aaa", "xcv", "bcd" ] } }
{ "someobject" : { "arrayfield" : [ "asd", "qwe" ] } }
{ "someobject" : { "arrayfield" : [ "bnm" ] } }
{ "someobject" : { "arrayfield" : [ "dfg", "sdf" ] } }
{ "someobject" : { "arrayfield" : [ "qwe" ] } }
正如您所看到的,它不是根据数组的第一个值进行排序,而是使用一些内部逻辑来比较整个数组。它如何确定 [ "rty", "aaa"]
应该准确地出现在 [ "xcv", "aaa", "bcd"]
之前?为什么 [ "xcv", "aaa", "bcd"]
出现在 [ "aaa", "xcv", "bcd"]
之前?或者它们是相等的并且它使用 _id 作为平局断路器?我真的不知道。
我以为它可能使用了标准的 javascript 比较运算符,但事实似乎也并非如此。我为每个数组创建了一个数组,并对其调用 .sort()
并得到了以下结果:
x.sort()
[ [ 'aaa', 'xcv', 'bcd' ],
[ 'asd', 'qwe' ],
[ 'bnm' ],
[ 'dfg', 'sdf' ],
[ 'qwe' ],
[ 'rty', 'aaa' ],
[ 'xcv', 'aaa', 'bcd' ] ]
这是有道理的,因为显然 javascript array comparison使用逗号分隔符连接元素,然后进行字符串比较。
mongodb 中的数组比较逻辑对我来说是个谜。但是,这带来了一种可能性,您可能不关心 mongodb 神秘的数组比较逻辑。如果您想要的只是一个稳定的排序,以便您可以跳过和限制分页,那么我想我有一个适合您的解决方案。
如果我们在数组的第一个值上创建索引,如下所示(使用 background:1
以避免锁定数据库):
db.mycoll.createIndex( { "someobject.arrayfield.0":1 }, {background:1} )
然后我们可以对数组中的第一个对象执行查找查询和排序,这将避免 SORT 阶段:
mongos> db.mycoll.find().sort({"someobject.arrayfield.0":1}).explain()
"winningPlan" : {
"stage" : "LIMIT",
"limitAmount" : 1,
"inputStage" : {
"stage" : "SKIP",
"skipAmount" : 1,
"inputStage" : {
"stage" : "FETCH",
"inputStage" : {
"stage" : "IXSCAN",
"keyPattern" : {
"someobject.arrayfield.0" : 1
},
"indexName" : "someobject.arrayfield.0_1",
"isMultiKey" : false,
"multiKeyPaths" : {
"someobject.arrayfield.0" : [ ]
},
"isUnique" : false,
"isSparse" : false,
"isPartial" : false,
"indexVersion" : 2,
"direction" : "forward",
"indexBounds" : {
"someobject.arrayfield.0" : [
"[MinKey, MaxKey]"
]
}
}
}
}
}
不再需要排序阶段!
<小时/>此提议的解决方案基于一个大假设,即您愿意接受与原始查询提供的排序顺序不同的排序顺序。我希望这个解决方案能够发挥作用,并且您能够以这种方式实现它。如果没有,也许其他人可以扩展这个想法。
关于Mongodb 按字符串数组排序并使用索引,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52857538/
如何使用 SPListCollection.Add(String, String, String, String, Int32, String, SPListTemplate.QuickLaunchO
我刚刚开始使用 C++ 并且对 C# 有一些经验,所以我有一些一般的编程经验。然而,似乎我马上就被击落了。我试过在谷歌上寻找,以免浪费任何人的时间,但没有结果。 int main(int argc,
这个问题已经有答案了: In Java 8 how do I transform a Map to another Map using a lambda? (8 个回答) Convert a Map>
我正在使用 node + typescript 和集成的 swagger 进行 API 调用。我 Swagger 提出以下要求 http://localhost:3033/employees/sear
我是 C++ 容器模板的新手。我收集了一些记录。每条记录都有一个唯一的名称,以及一个字段/值对列表。将按名称访问记录。字段/值对的顺序很重要。因此我设计如下: typedef string
我需要这两种方法,但j2me没有,我找到了一个replaceall();但这是 replaceall(string,string,string); 第二个方法是SringBuffer但在j2me中它没
If string is an alias of String in the .net framework为什么会发生这种情况,我应该如何解释它: type JustAString = string
我有两个列表(或字符串):一个大,另一个小。 我想检查较大的(A)是否包含小的(B)。 我的期望如下: 案例 1. B 是 A 的子集 A = [1,2,3] B = [1,2] contains(A
我有一个似乎无法解决的小问题。 这里...我有一个像这样创建的输入... var input = $(''); 如果我这样做......一切都很好 $(this).append(input); 如果我
我有以下代码片段 string[] lines = objects.Split(new string[] { "\r\n", "\n" }, StringSplitOptions.No
这可能真的很简单,但我已经坚持了一段时间了。 我正在尝试输出一个字符串,然后输出一个带有两位小数的 double ,后跟另一个字符串,这是我的代码。 System.out.printf("成本:%.2
以下是 Cloud Firestore 列表查询中的示例之一 citiesRef.where("state", ">=", "CA").where("state", "= 字符串,我们在Stack O
我正在尝试检查一个字符串是否包含在另一个字符串中。后面的代码非常简单。我怎样才能在 jquery 中做到这一点? function deleteRow(locName, locID) { if
这个问题在这里已经有了答案: How to implement big int in C++ (14 个答案) 关闭 9 年前。 我有 2 个字符串,都只包含数字。这些数字大于 uint64_t 的
我有一个带有自定义转换器的 Dozer 映射: com.xyz.Customer com.xyz.CustomerDAO customerName
这个问题在这里已经有了答案: How do I compare strings in Java? (23 个回答) 关闭 6 年前。 我想了解字符串池的工作原理以及一个字符串等于另一个字符串的规则是
我已阅读 this问题和其他一些问题。但它们与我的问题有些无关 对于 UILabel 如果你不指定 ? 或 ! 你会得到这样的错误: @IBOutlet property has non-option
这两种方法中哪一种在理论上更快,为什么? (指向字符串的指针必须是常量。) destination[count] 和 *destination++ 之间的确切区别是什么? destination[co
This question already has answers here: Closed 11 years ago. Possible Duplicates: Is String.Format a
我有一个Stream一个文件的,现在我想将相同的单词组合成 Map这很重要,这个词在 Stream 中出现的频率. 我知道我必须使用 collect(Collectors.groupingBy(..)
我是一名优秀的程序员,十分优秀!