gpt4 book ai didi

Solr 动态字段类型

转载 作者:行者123 更新时间:2023-12-05 01:34:27 26 4
gpt4 key购买 nike

我在 Solr 中有一个字段

<dynamicField name="Phrase_*" type="string" indexed="true" stored="true" multiValued="true" required="false"/>

它用于保存不同语言的短语,因此名称往往是“Phrase_en”、“Phrase_sp”等。我有分析器和过滤器来处理以类似方式命名的类型的不同语言字段(“string_en”, “string_sp”等)为相应的语言做正确的词干提取/同义词,我想找到某种方法来装配它,以便根据字段名称为每种语言使用正确的分析器/过滤器集.

目前,我唯一能想到的就是创建一个多路复用这些分析器集的类型,并判断将其发送给哪个,但我不知道该怎么做。

关于如何实现这一目标的任何想法,或者实现该目标的更好方法?

最佳答案

这个问题在 Solr In Action 一书中有相当多的细节(强烈推荐给那些希望深入了解 Solr 配置的人)和其他试图实现相同结果的人。有3种基本方法:

  • 每种语言的单独字段 - 加载到单独的字段(不是
    动态),每种语言都有适当的分词器和过滤器
  • 每种语言的单独索引/核心 -
  • 一个领域的一切,定制
    要管理的代码 -

  • 你的提议是 1 和 3 的变体——我能给你的最好的起点是阅读有问题的书(在第 14 章中)并研究他放在 Github 上的代码来实现它:

    https://github.com/treygrainger/solr-in-action/tree/master/src/main/java/sia/ch14
    https://github.com/treygrainger/solr-in-action/tree/master/example-docs/ch14/cores

    关于Solr 动态字段类型,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23747373/

    26 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com