gpt4 book ai didi

solr - 如何在 Solr 中配置词干提取?

转载 作者:行者123 更新时间:2023-12-04 12:24:42 24 4
gpt4 key购买 nike

我添加到 solr 索引:“美国人”。当我按“美国”搜索时,没有结果。

应该如何配置 schema.xml 以获得结果?

当前配置:

<fieldType name="text" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="solr.WhitespaceTokenizerFactory" />
<filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true" />
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
<filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" />
<filter class="solr.LowerCaseFilterFactory" />
<filter class="solr.EnglishPorterFilterFactory" protected="protwords.txt" />
<filter class="solr.RemoveDuplicatesTokenFilterFactory" />
<filter class="solr.PorterStemFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="solr.WhitespaceTokenizerFactory" />
<filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true" />
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
<filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="0" catenateNumbers="0" catenateAll="0" />
<filter class="solr.LowerCaseFilterFactory" />
<filter class="solr.EnglishPorterFilterFactory" protected="protwords.txt" />
<filter class="solr.RemoveDuplicatesTokenFilterFactory" />
<filter class="solr.PorterStemFilterFactory"/>
</analyzer>
</fieldType>

最佳答案

为什么会有两个词干分析器?
尝试删除 EnglishPorterFilterFactory (已弃用)从您的两种分析器类型中重建索引,然后尝试搜索 American 是否会产生 America。

如果这不起作用,您可以尝试的另一件事是删除两个词干过滤器并添加 SnowballPorterFilterFactorylanguage="English"反而。

关于solr - 如何在 Solr 中配置词干提取?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5285916/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com