gpt4 book ai didi

lucene - Solr 关联

转载 作者:行者123 更新时间:2023-12-04 15:04:52 29 4
gpt4 key购买 nike

最近几天,我们考虑使用 Solr 作为我们的首选搜索引擎。
我们需要的大多数功能都是开箱即用的,或者可以轻松配置。
然而,我们绝对需要的一项功能似乎在 Solr 中被很好地隐藏(或缺失)了。

我会试着用一个例子来解释。我们有很多实际上是业务的文件:

<document>
<name>Apache</name>
<cat>1</cat>
...
</document>
<document>
<name>McDonalds</name>
<cat>2</cat>
...
</document>

此外,我们还有另一个包含所有类别和同义词的 xml 文件:
<cat id=1>
<name>software</name>
<synonym>IT<synonym>
</cat>
<cat id=2>
<name>fast food</name>
<synonym>restaurant<synonym>
</cat>

我们希望将业务和类别关联起来,以便我们可以使用类别的名称和/或同义词进行搜索。但是我们不想在索引时合并这些文件,因为我们应该更新类别(adding.remioving 同义词...)而不再次索引所有业务。

Solr 中是否有任何东西可以进行这种关联,或者我们是否需要开发一些特定的部分?

欢迎所有反馈和建议。

提前致谢,
汤姆

最佳答案

基本上你在这里有一个设计决定。人们对 Solr 索引所做的常见事情是对它们进行非规范化,即将类别定义分解到业务文档中。
由于您不想这样做,我建议保留两种类型的文档 - 一种用于业务,另一种用于类别。您可以将两者保存在同一个索引中,因为 Solr 不要求所有文档都具有相同的字段。业务文档看起来很简单,但您必须使它们可以通过业务名称和类别 ID 进行搜索。我建议为每个同义词创建一个类别文档,您可以在其中按同义词搜索并找到 id(和类别名称)。

要使用同义词搜索,您需要进行双重搜索 -

  • 使用名称的文本搜索类别 ID。
  • 使用类别 ID 搜索企业。
  • 关于lucene - Solr 关联,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2689399/

    29 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com