gpt4 book ai didi

string - ElasticSearch 错误地索引和查询非字母数字字符

转载 作者:行者123 更新时间:2023-11-29 02:48:13 24 4
gpt4 key购买 nike

我的 ElasticSearch 索引没有正确索引和查询非字母数字字符。具体来说,点和破折号会导致问题。

如果我索引一个名为“O.K. Corral”的文档,它应该匹配“OK Corral”的查询。同样,如果我索引“Whiskey A Go-Go”,我希望它匹配“Whiskey A GoGo”和“Whiskey A Go Go”。

现在,只有使用正确的点和破折号的查询才会返回这些文档。

我希望该解决方案还可以解决其他非字母数字字符(如逗号和撇号)的任何潜在问题。

这听起来像是 ElasticSearch token 过滤器的工作,但我一直没能找到能满足我要求的功能。此外,我想在 ElasticSearch 中执行此操作——我不想编写自定义字符串操作以在数据到达我的 ES 索引之前对其进行规范化。

感谢您的帮助!

最佳答案

您可能想看看 Word Delimiter Token Filter .它至少会用“Whiskey A GoGo”和“Whiskey A Go-Go”做你想做的事。您可以使用 analyze api 提前检查其行为.

关于string - ElasticSearch 错误地索引和查询非字母数字字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12168948/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com