gpt4 book ai didi

solr - 将 Solr 重复值删除到多值字段中

转载 作者:行者123 更新时间:2023-12-02 04:11:50 24 4
gpt4 key购买 nike

我的 Solr 索引包含一个具有重复值的多值字段。如何删除重复项?

索引时是否可以将重复值覆盖到多值字段中?

谢谢

最佳答案

参加派对真的很晚了,但是在 Solr 6.0 中,最重要的答案对我来说不起作用,因为我试图在多值字段上添加重复条目。它在 UniqFieldsUpdateProcessorFactory 之前缺少处理器。因此,将这样的内容添加到我的 solrconfig.xml 中是有效的:

<updateRequestProcessorChain name="uniq-fields">
<processor class="org.apache.solr.update.processor.DistributedUpdateProcessorFactory"/>
<processor class="org.apache.solr.update.processor.UniqFieldsUpdateProcessorFactory">
<str name="fieldName">YourFieldA</str>
<str name="fieldName">yourFieldB</str>
</processor>
<processor class="solr.RunUpdateProcessorFactory" />

其中 YourFieldA 和 YourFieldB 是 schema.xml 中定义的字段。请注意,您还必须将其添加到正确的 requestHandler 中,即:

  <requestHandler name="/update" class="solr.UpdateRequestHandler" >
<lst name="defaults">
<str name="update.chain">uniq-fields</str>
</lst>

这不仅可以防止添加重复项,还可以在更新指定字段时从索引中删除所有重复项。

关于solr - 将 Solr 重复值删除到多值字段中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13306272/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com