gpt4 book ai didi

lucene - solr 中的 ToTitleCase 以停止 Solr 中的 SCREAMING CAPS

转载 作者:行者123 更新时间:2023-12-04 06:58:34 26 4
gpt4 key购买 nike

我正在使用 solr 的分面,但遇到了一个问题,我希望我可以绕过使用过滤器。

基本上有时一个城镇名称会出现在 SOLR 中

“剑桥”

有时它会通过

“剑桥”

我想在 Solr 中使用过滤器来阻止城镇名称的 SCREAMING CAPS 版本。似乎有一个适合制作所有文字的工具lower case .

<!-- A text field that only sorts out casing for faceting -->
<fieldType name="text_facet" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
</fieldType>

我想知道是否有人知道过滤器会忽略单词的第一个字符并将小写字母应用于其余字符。例如。
  • 剑桥 >> 剑桥
  • 赫尔河畔金斯敦 >> 赫尔河畔金斯敦

  • 等等

    或者,如果编写自己的过滤器很容易.. 一些有关如何做到这一点的帮助将不胜感激.. 我不是 Java 人..

    谢谢

    最佳答案

    AFAIK 没有这样的内置过滤器。想写就看LowerCaseFilterFactoryLowerCaseFilter作为引用,这似乎并不难。

    或者,您可以在客户端执行此操作,即在 SolrNet 中,您可以编写一个 ISolrOperations 装饰器,使用 ToTitleCase 在实际查询之后进行必要的转换。 .

    关于lucene - solr 中的 ToTitleCase 以停止 Solr 中的 SCREAMING CAPS,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2230376/

    26 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com