gpt4 book ai didi

许多(嵌套)字段/属性上的 MongoDB 索引

转载 作者:可可西里 更新时间:2023-11-01 09:45:06 25 4
gpt4 key购买 nike

在电子商务应用程序中,我有这样的文档:

{ category:'A', ..., price:122,
attr:{ width:6, height:4, hasLCD:true, lcdType:'some text', ..., a36:null }
}

即每个产品都有许多简单类型的属性。

现在我想通过包含顶级字段和一些属性的动态查询来过滤产品。例如:

find({category:'A', price:{$lt:200}, ...,
'attr.height':{$lt:6}, 'attr.hasLCD':true, 'attr.lcdType':{$in:[...]}, ...})

我希望它能够快速执行。

尝试对所有可能的“attr.*”变体进行索引会给我一个错误(复合键太多)。我还怀疑,如果我以这种方式对其进行索引,然后在查询索引中省略其中一个属性将无法正常工作。

尝试将“attr”作为一个整体进行索引也无济于事。

在 MongoDB 下建模的正确方法是什么?

更新

我试过了this方法(也提到了 here )。 IE。将属性存储为键值对数组:

attr2: [ {tag:'lcgType', value:'some text'}, ...

然后像这样索引它:

ensureIndex({ 'attr2.tag':1, 'attr2.value':1 })

然后像这样查询:

find({attr2:{$all:[
{$elemMatch:{tag:'bestseller',value:true}},
{$elemMatch:{tag:'weight',value:{$lte:100}}}
]}})

现在 explain() 说它正在使用 "BtreeCursor attr2.tag_1_attr2.value_1" 但仍然是 "nscanned": 31607 并且整个执行时间实际上是 增加(与非索引方案相比)。

这里有问题。

子问题

如果我选择一些(少于 31 个)最常查询的属性并尝试在这些属性上建立索引会怎样?如果我将它们全部放在单个复合索引中:

ensureIndex({'attr.a1':1, 'attr.a2':1, ...})

根据docs此索引不会用于缺少 attr.a1 属性的查询。

在这种情况下如何定义索引?

最佳答案

如果您真的必须允许大量的过滤器、组合甚至排序,MongoDB 不是一个好的选择,因为它使用 only one index per query .索引的数量增长太快,因为 compound keys are somewhat inflexible (应该回答子问题)并成为性能 pig 。

使用 ElasticSearch、SolR 等搜索数据库,而不是具有您需要的功能的搜索数据库。如果您想在 MongoDB 中保留基本信息,您可以在搜索服务器返回的 ID 上使用 $in(让搜索数据库简单地复制主数据库的信息通常是个好主意数据存储,因此您不需要双向同步更改,这将是一场噩梦)

关于许多(嵌套)字段/属性上的 MongoDB 索引,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19692105/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com