gpt4 book ai didi

node.js - 为 MongoDB 中的对象数组建立索引

转载 作者:太空宇宙 更新时间:2023-11-04 02:29:48 26 4
gpt4 key购买 nike

我有一个巨大的电子邮件转储,我正在尝试在 MongoDB 中存储和查询。有 160 万封电子邮件,每封都存储为 Node module 的输出。将原始电子邮件解析为漂亮的 Javascript 对象,如下所示:

{
"text" : "This is the text of my email",
"subject" : "Great opportunity",
"from" : [
{
"address" : "chris.wilson@example.com",
"name" : "Chris Wilson"
}
],
"to" : [
{
"address" : "person.a@example.com",
"name" : "Person A"
},
{
"address" : "person.b@example.com",
"name" : "Person B"
},
{
"address" : "person.c@example.com",
"name" : "Person C"
}
],
"date" : ISODate("2015-01-05T21:38:55.000Z")
}

我需要能够有效地查找诸如“发送到 person.a@gmail.com 的所有电子邮件”或“‘Chris Wilson’发送的每封电子邮件”(无论该姓名附加哪个电子邮件地址)之类的内容。

Mongo 非常愿意为我索引“to”和“from”查询,但我不确定当我这样做时查询是否有效:

db.emails.find({ "to.name": "Person A" })

这是一个覆盖查询,用于在作为键值对象数组的字段中查找特定属性的特定值吗?这个查询对我来说运行速度非常慢,但话又说回来,它是一个很大的语料库。

更新

以下是将“.explain”附加到上述查询的输出:

{
"cursor" : "BasicCursor",
"isMultiKey" : false,
"n" : 24,
"nscannedObjects" : 1646837,
"nscanned" : 1646837,
"nscannedObjectsAllPlans" : 1646837,
"nscannedAllPlans" : 1646837,
"scanAndOrder" : false,
"indexOnly" : false,
"nYields" : 17088,
"nChunkSkips" : 0,
"millis" : 84685,
"server" : "DCA-TM-GUEST-iMac.local:27017",
"filterSet" : false
}

最佳答案

那很好,是的。不过,您需要在 to.name 上建立索引才能提高查询效率。事实上,它当前使用 BasicCursor 表明没有索引,或者未使用索引 - 这相当奇怪。作为引用,这些称为“multikeys” '.

Is this a covered query [...]

我猜你所说的“覆盖”是指“MongoDB 是否覆盖了此功能”? “覆盖查询”是一个术语,用于表示可以单独使用索引来回答的查询。仅当您想要返回的所有字段都是索引的一部分时(例如,给我 id,并且仅提供发送给 John Doe 的电子邮件的 id),查询才能被索引覆盖,但我想在这种情况下这没有多大意义。另外,遗憾的是,它是 not supported when reaching into documents还没有。

关于node.js - 为 MongoDB 中的对象数组建立索引,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27803725/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com