gpt4 book ai didi

node.js - MongoDB/Mongoose 索引使查询更快还是变慢?

转载 作者:IT老高 更新时间:2023-10-28 13:35:24 25 4
gpt4 key购买 nike

我有一个这样的文章模型:

var ArticleSchema = new Schema({

type: String
,title: String
,content: String
,hashtags: [String]

,comments: [{
type: Schema.ObjectId
,ref: 'Comment'
}]

,replies: [{
type: Schema.ObjectId
,ref: 'Reply'
}]

, status: String
,statusMeta: {
createdBy: {
type: Schema.ObjectId
,ref: 'User'
}
,createdDate: Date
, updatedBy: {
type: Schema.ObjectId
,ref: 'User'
}
,updatedDate: Date

,deletedBy: {
type: Schema.ObjectId,
ref: 'User'
}
,deletedDate: Date

,undeletedBy: {
type: Schema.ObjectId,
ref: 'User'
}
,undeletedDate: Date

,bannedBy: {
type: Schema.ObjectId,
ref: 'User'
}
,bannedDate: Date
,unbannedBy: {
type: Schema.ObjectId,
ref: 'User'
}

,unbannedDate: Date
}
}, {minimize: false})

当用户创建或修改文章时,我会创建hashtags

ArticleSchema.pre('save', true, function(next, done) {
var self = this
if (self.isModified('content')) {
self.hashtags = helper.listHashtagsInText(self.content)
}
done()
return next()
})

例如,如果用户写 "Hi, #greeting, i love #friday",我会将 ['greeting', 'friday'] 存储在标签列表中.

我正在考虑为主题标签创建索引,以便更快地查询主题标签。但是从 Mongoose 手册中,我发现了这个:

When your application starts up, Mongoose automatically calls ensureIndex for each defined index in your schema. Mongoose will call ensureIndex for each index sequentially, and emit an 'index' event on the model when all the ensureIndex calls succeeded or when there was an error. While nice for development, it is recommended this behavior be disabled in production since index creation can cause a significant performance impact. Disable the behavior by setting the autoIndex option of your schema to false.

http://mongoosejs.com/docs/guide.html

那么对于 mongoDB/Mongoose,索引是更快还是更慢?

另外,即使我创建了类似的索引

  hashtags: { type: [String], index: true }

如何在查询中使用索引?或者对于普通查询,它会神奇地变得更快,例如:

   Article.find({hashtags: 'friday'})

最佳答案

你看错了

您误读了引用 block 的意图,即 .ensureIndex() (现在已弃用,但仍由 mongoose 代码调用)实际上是在上下文中执行的。

在 mongoose 中,您可以在架构或模型级别定义适合您设计的索引。 Mongoose “自动”为您做的是在连接时检查每个注册的模型,然后为提供的索引定义调用适当的 .ensureIndex() 方法。

这实际上是做什么的?

嗯,在大多数情况下,在您之前已经启动过您的应用程序之后,.ensureIndexes()运行的方法是绝对没有。这有点夸大其词,但或多或​​少听起来是对的。

因为已经在服务器集合上创建了索引定义,所以后续调用不会做任何事情。即,它不会删除索引并“重新创建”。因此,一旦创建了索引本身,真正的成本基本上就没有了。

创建索引

因此,由于 mongoose 只是标准 API 之上的一层,createIndex()方法包含正在发生的事情的所有细节。

这里有一些细节需要考虑,例如索引构建可能发生在“后台”中,虽然这对您的应用程序的干扰较小,但它确实需要自己付出代价。值得注意的是,“后台”生成的索引大小将比在前台构建时更大,从而阻塞其他操作。

此外,所有索引都是有成本的,尤其是在磁盘使用方面,以及在收集数据本身之外写入额外信息的额外成本。

索引的优点是“搜索”索引中包含的值比搜索整个集合并匹配可能的条件要快得多。

这些是与索引相关的基本“权衡”。

部署模式

返回 quoted block从文档中可以看出,这个建议背后有一个真正的意图。

在部署模式中很典型,尤其是在数据迁移中按此顺序执行操作:

  1. 将数据填充到相关集合/表中
  2. 为与您的需求相关的集合/表数据启用索引

这是因为创建索引会产生成本,如前所述,希望从索引构建中获得最佳大小,同时避免每个文档插入也有编写索引条目的开销当您批量执行此“加载”时。

这就是索引的用途,它们是成本和 yield ,并且解释了 mongoose 文档中的信息。

一般来说,我建议阅读 Database Indexes他们是什么以及他们做什么。想想走进图书馆找一本书。入口处有卡片索引。你会在图书馆里四处走走寻找你想要的书吗?或者你在卡片索引中查找它以找到它的位置?该索引需要花费一些时间来创建并保持更新,但它可以节省“您”在整个图书馆走动的时间,以便您可以找到您的书。

关于node.js - MongoDB/Mongoose 索引使查询更快还是变慢?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31738418/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com