gpt4 book ai didi

mongodb 不为 $exists 和 $elemMatch 使用索引

转载 作者:可可西里 更新时间:2023-11-01 09:13:14 26 4
gpt4 key购买 nike

我的文档结构是这样的

{
"_id" : "311acd33a0ae8dcc3101246f90af9dc5",
"created_datetime" : ISODate("2013-04-05T10:35:31.143Z"),
"installs" : [
{
"status" : 1,
"app" : "xyz",
"reg_id" : "AVJyaIFI2Q8v93YmOHI5kEOVoCLbd4CAUyVK9zLrC1QCiBcl_bw89i5PvhEuTKmxtb4x130vjMyo78zPI7cedErcRv_Jjn0BN3Wq40hhg",
"last_action_datetime" : ISODate("2013-04-05T10:35:31.143Z"),
"version" : "2"
},
{
"status" : 1,
"app" : "abc",
"reg_id" : "AVJyaIFI2Q8v93YmOHI5kEOVoCLbd4CAUyVK9zLrC1QCiBcl_bw89i5PvhEuTKmxtb4x130vjMyo78zPI7cedErcRv_Jjn0BN3Wq40hhg",
"last_action_datetime" : ISODate("2013-04-05T10:35:31.143Z"),
"version" : "5"
},
{
"status" : 1,
"app" : "pqr",
"last_action_datetime" : ISODate("2013-04-06T10:35:31.143Z"),
"version" : "1"
},
],
"last_update" : ISODate("2013-04-12T06:26:46.333Z"),
"num_updates" : 9,
.....
}

我在 'install.reg_id''installs.status' 上有一个复合索引,在 'installs.status'

现在我想找到所有文档,其中至少 installs 的一个元素包含 reg_id 并且它的 status 是 1。所以我查询

db.users.find({'installs': {'$elemMatch': {'reg_id': {'$exists':  true}, 'status': 1}}}).explain()

我明白了

{
"cursor" : "BtreeCursor installs.status_1",
"isMultiKey" : true,
"n" : 1447034,
"nscannedObjects" : 1720864,
"nscanned" : 1720864,
"nscannedObjectsAllPlans" : 1720864,
"nscannedAllPlans" : 1720864,
"scanAndOrder" : false,
"indexOnly" : false,
"nYields" : 13072,
"nChunkSkips" : 0,
"millis" : 11063,
"indexBounds" : {
"installs.status" : [
[
1,
1
]
]
},
"server" : "####:27017"
}

所以这里应该使用了复合索引,但没有使用。我认为 $elemMatch 是罪魁祸首,所以我做了这个查询

db.users.find({'installs.reg_id': {'$exists':  true}}).explain()

我明白了

{
"cursor" : "BasicCursor",
"isMultiKey" : false,
"n" : 2947446,
"nscannedObjects" : 3184871,
"nscanned" : 3184871,
"nscannedObjectsAllPlans" : 3184871,
"nscannedAllPlans" : 3184871,
"scanAndOrder" : false,
"indexOnly" : false,
"nYields" : 23865,
"nChunkSkips" : 0,
"millis" : 16172,
"indexBounds" : {

},
"server" : "####:27017"
}

这表明查询没有使用任何索引。

知道这里出了什么问题吗?

更新:添加提示确实使查询使用索引

db.users.find({'installs': {'$elemMatch': {'reg_id': {'$exists':  true}, 'status': 1}}}).hint({"installs.reg_id":1,"installs.status":1}).explain()

返回

{
"cursor" : "BtreeCursor installs.reg_id_1_installs.status_1",
"isMultiKey" : true,
"n" : 1451589,
"nscannedObjects" : 2464985,
"nscanned" : 4373261,
"nscannedObjectsAllPlans" : 2464985,
"nscannedAllPlans" : 4373261,
"scanAndOrder" : false,
"indexOnly" : false,
"nYields" : 20170,
"nChunkSkips" : 0,
"millis" : 106353,
"indexBounds" : {
"installs.reg_id" : [
[
{
"$minElement" : 1
},
{
"$maxElement" : 1
}
]
],
"installs.status" : [
[
1,
1
]
]
},
"server" : "####:27017"
}

这里使用复合索引。

最佳答案

没有任何问题。查询优化器正在选择提供更好性能/选择性的索引。

您可以通过“提示”查询使用您希望它使用的索引并比较它需要扫描多少元素和文档以找到它需要返回的元素和文档来确认这一点。

查看您的解释,我可以看到 reg_id 存在于您希望查询使用的索引中超过 92.5% 的索引条目中。这不是很有选择性。使用您希望它使用的索引只会将 3.1M 文档/条目缩小到 2.9M - 不是很好。

它使用 status_1 索引立即将“候选者”缩小到 170 万,现在遍历所有候选者,它发现 140 万有 reg_id。

拥有更多选择性索引是关键,但不要忘记,在这种情况下,您要求它返回 1.4M 文档,因此当需要扫描这么多文档时,很难非常有选择性.

另一件事是相等性,与 {$exists} 相比,这样的索引操作(甚至不相等)更有效。即使是 {$ne:null} 也会比 $exists 更好——一般来说,依靠使用 $exists 或什至不等式的查询来实现像相等性或更小范围的查询(当使用索引时)那样的性能并不是一个好主意.

可在此处找到更多信息:http://docs.mongodb.org/manual/applications/indexes/特别是这里:http://docs.mongodb.org/manual/tutorial/create-queries-that-ensure-selectivity/

关于mongodb 不为 $exists 和 $elemMatch 使用索引,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16511188/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com