db.collection.in-6ren">
gpt4 book ai didi

mongodb - 在俄语的 mongodb 中进行全文搜索

转载 作者:可可西里 更新时间:2023-11-01 09:12:31 31 4
gpt4 key购买 nike

我正在尝试在 mongodb 中使用全文搜索:

> db.collection.insert({"text" : "Первый второй третий"})
> db.collection.insert({"text" : "первый Второй третий"})
> db.collection.insert({"text" : "первый второй Третий"})
> db.collection.ensureIndex({"text" : "text"}, {"default_language" : "russian"})

句子仅在字母大小写上有所不同。

> db.collection.runCommand("text" , {search : "первый"})
{
"queryDebugString" : "перв||||||",
"language" : "russian",
"results" : [
{
"score" : 0.6666666666666666,
"obj" : {
"_id" : ObjectId("516acfe2dbfd90a837e09131"),
"text" : "первый Второй третий"
}
},
{
"score" : 0.6666666666666666,
"obj" : {
"_id" : ObjectId("516acfe8dbfd90a837e09132"),
"text" : "первый второй Третий"
}
}
],
"stats" : {
"nscanned" : 2,
"nscannedObjects" : 0,
"n" : 2,
"nfound" : 2,
"timeMicros" : 86
},
"ok" : 1
}

结果只包含两个条目,但应该是三个。用英语一切都很好。

最佳答案

这是文本搜索的已知限制,因为它存在于 MongoDB 2.4 中。出于文本搜索的目的,MongoDB 会将每个字符“ABCDEFGHIJKLMNOPQRSTUVWXYZ”(在 POSIX 语言环境中设置的“大写”)视为与其等效的小写相同,但它将其他 UTF-8 代码点视为唯一。

UTF-8 的完整大小写折叠支持将在未来的版本中推出;在 https://jira.mongodb.org/browse/SERVER-8423 中查看 JIRA 中的相关票证.

关于mongodb - 在俄语的 mongodb 中进行全文搜索,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16001132/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com