gpt4 book ai didi

python - django haystack/whoosh : find records with umlauts/diaeresis, 带有普通的 ascii 查询

转载 作者:太空宇宙 更新时间:2023-11-04 00:54:51 24 4
gpt4 key购买 nike

我的大海捞针中有变音符号/分音符和其他特殊字符(ä、ö、ü、é、è、ç 等)。它们似乎被很好地编入索引,并且在搜索时可以找到,因为它们在索引中。

示例:搜索“Häberli”会返回包含它的所有记录。

我想要的:搜索“Haberli”也应该返回所有这些记录。我目前正在使用 SearchQuerySet.auto_query()。我没有在文档中找到任何提示。

奖励:搜索“Haeberli”也应返回这些结果。

我正在使用 django 1.8.5、haystack 2.4.1 和 whoosh 2.7.0

最佳答案

您想在 Elasticsearch 中使用 ascii 折叠标记过滤器:关注 this链接。

编辑:再次阅读您的问题...您想要使用 Whoosh 进行字符折叠的 whoosh.analysis.CharsetFilter

这是完整解决方案的要点:link .

关于python - django haystack/whoosh : find records with umlauts/diaeresis, 带有普通的 ascii 查询,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35565262/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com