gpt4 book ai didi

Solr 如何使用普通字符 N 搜索 ñ 和 Ñ 反之亦然

转载 作者:行者123 更新时间:2023-12-04 00:37:49 28 4
gpt4 key购买 nike

我们如何将非 ASCII 字符映射到 ASCII 字符?

例如:在 solr 索引中,我们有包含 char ñ, Ñ [LATIN CAPITAL LETTER N WITH TILDE] 或 normal n,N 的单词然后我们使用什么过滤器/标记来搜索 Normal N 或 Ñ 并且都映射。

最佳答案

合并 Solr, Special Chars, and Latin to Cyrilic char conversion 的答案

  1. 看看Solr's Analyzers, Tokenizers, and Token Filters这很好地介绍了您正在寻找的操作类型。
  2. 可能 the ASCIIFoldingFilterFactory完全按照您的意愿行事。

当更改分析器以删除重音符号时,请记住您需要重新索引。否则重音字符将保留在索引中,但无法创建匹配它们的用户输入。

更新

我尝试使用 the ICUFoldingFilterFactory这适用于那些口音。如果这个很难设置,请查看 SO 问题 Can not use ICUTokenizerFactory in Solr

这个分析器

<fieldType name="spanish" class="solr.TextField">
<analyzer>
<tokenizer class="solr.StandardTokenizerFactory" />
<filter class="solr.ICUFoldingFilterFactory" />
</analyzer>
</fieldType>

得到这些分析结果,截图来自solr-admin

enter image description here

关于Solr 如何使用普通字符 N 搜索 ñ 和 Ñ 反之亦然,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22714285/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com