gpt4 book ai didi

elasticsearch - Elasticsearch 接缝,可在全文搜索过程中使用孤立的搜索词对结果进行优先级排序

转载 作者:行者123 更新时间:2023-12-03 02:14:53 28 4
gpt4 key购买 nike

我在使用 Elasticsearch 时遇到问题。它表明搜索词正在搜索结果中被隔离。
我们有一个大型字幕数据库,该数据库使用Elastic Search进行了索引。
但是,这似乎表明,我们的搜索会优先搜索隔离搜索字词的搜索结果。
即:搜索“吃”会产生:
哦,跳伞。 //高空跳伞。 //哦,我有那个。 // 疯狂地食用。 // 。 //刚过去,刚过去。 //你们很烂。 // 那是什么? //花样游泳

这是我的最后一晚,所以我们要生活//就像没有明天一样。 //-我想我想///- Eat。 //-带上所有食物,//是否是麦当劳的食品,或者是否-//冰淇淋。
我们需要INSTEAD优先搜索在句子中找到searchTerm的搜索结果,而不是单独搜索。
我需要帮助来确定需要修复的内容-映射,过滤器, token 生成器等。
这是我的设置:

static public function getSettings(){
return [
'number_of_shards' => 1,
'number_of_replicas' => 1,
'analysis' => [
'filter' => [
'filter_stemmer' => [
'type' => 'stemmer',
'language' => 'english'
]
],
'analyzer' => [
'text_analyzer' => [
'type' => 'custom',
"stopwords" => [],
'filter' => ['lowercase', 'filter_stemmer','stemmer'],
'tokenizer' => 'standard'
],
]
]
];
}
这是我的映射:
https://gist.github.com/firecentaur/d0e1e196f7fddbb4d02935bec5592009
这是我的搜索
https://gist.github.com/firecentaur/5ac97bbd8eb02c406d6eecf867afc13c
我究竟做错了什么?

最佳答案

此行为必须由TL / IDF算法引起。
如果查询与某个字段匹配,则查询中的单词很少。
如果要使其适应您的用例,则可以使用function_score查询。
这篇文章应该可以帮助您找到解决方案。
How can I boost the field length norm in elasticsearch function score?

关于elasticsearch - Elasticsearch 接缝,可在全文搜索过程中使用孤立的搜索词对结果进行优先级排序,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63801932/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com