gpt4 book ai didi

mongodb - Mongodb $文本​​查询: return docs "starting with" string before others

转载 作者:IT老高 更新时间:2023-10-28 13:09:28 25 4
gpt4 key购买 nike

假设我有一个 itemName 字段上有一个 text index 的 mongo 集合,其中包含以下 3 个文档:

{
_id: ...,
itemName: 'Mashed carrots with big carrot pieces',
price: 1.29
},
{
_id: ...,
itemName: 'Carrot juice',
price: 0.79
},
{
_id: ...,
itemName: 'Apple juice',
price: 1.49
}

然后我执行如下查询:

db.items.find({ $text: { $search: 'Car' } }, { score: { $meta: "textScore" } }).sort( { score: { $meta: "textScore" } } );

如何强制 mongo 返回以“Car”开头的文档(不区分大小写)返回任何其他在 中某处也包含“Car”的文档之前itemName 字符串?

所以我想按以下顺序检索文档:

[
{..., itemName: 'Carrot Juice', ...},
{..., itemName: 'Mashed carrots with big carrot pieces', ...}
]

当然,这是在搜索功能中使用的,因此在显示之后的任何其他项目之前,向用户显示他的搜索字符串开头的项目是完全有意义的。

直到现在我都在使用标准的正则表达式,但这里的性能当然要差得多! + 因为我必须搜索不区分大小写,根据文档,正常的正则表达式根本不使用任何索引?!

编辑:

另外,有时 $text 的行为很奇怪。例如,我有大约 10-15 个项目,其中 itemName 以单词“Zwiebel”开头。这个查询

db.items.find({ $text: { $search: "Zwiebel" }, supplier_id: 'iNTJHEf5YgBPicTrJ' }, { score: { $meta: "textScore" } }).sort( { score: { $meta: "textScore" } } );

像一个魅力一样工作并返回所有这些文档,而这个查询

db.items.find({ $text: { $search: "Zwie" }, supplier_id: 'iNTJHEf5YgBPicTrJ' }, { score: { $meta: "textScore" } }).sort( { score: { $meta: "textScore" } } );

不返回任何东西!只需在 $search 中将“Zwiebel”更改为“Zwie”即可。

我真的不明白这怎么可能?!

最好的,P

最佳答案

解决方案是使用 $indexOfCP MongoDB 3.4

中引入的运算符

该运算符返回一个字符串在另一个字符串中出现的索引,如果没有出现则返回-1

它是如何工作的:

  1. 使用正则表达式过滤掉所有不包含“car”的文档:/car/gi(不区分大小写)
  2. 创建一个名为 index 的字段,该字段将“car”的索引存储在 itemName
  3. index 字段的文档进行排序

查询将如下所示:

db.items.aggregate([
{
$match:{
itemName:/car/gi
}
},
{
$project:{
index:{
$indexOfCP:[
{
$toLower:"$itemName"
},
"car"
]
},
price:1,
itemName:1
}
},
{
$sort:{
index:1
}
}
])

这会返回:

{ "_id" : 2, "itemName" : "Carrot juice", "price" : 0.79, "index" : 0 }
{ "_id" : 1, "itemName" : "Mashed carrots with big carrot pieces", "price" : 1.29, "index" : 7 }

在线试用:mongoplayground.net/p/FqqCUQI3D-E

编辑:

对于$text 的行为索引,这是完全正常的

文本索引使用分隔符标记文本(默认分隔符是空格和标点符号)。它只能用于搜索整个世界,因此它不适用于单词的子部分

来自 mongodb text index documentation

$text will tokenize the search string using whitespace and most punctuation as delimiters, and perform a logical OR of all such tokens in the search string.

关于mongodb - Mongodb $文本​​查询: return docs "starting with" string before others,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42468618/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com