gpt4 book ai didi

search - Solr和ElasticSearch的可伸缩性:5000个值的字段

转载 作者:行者123 更新时间:2023-12-03 00:43:58 24 4
gpt4 key购买 nike

我需要将记录发送到搜索引擎(Solr或ElasticSearch)以建立索引。

在我的设计中,一个字段最多可以有5000个值,对于某些记录,该字段的所有这5000个值(OR或AND关系)都需要发送到搜索引擎。

我大约有10个具有这种性质的字段,另外还有30个其他字段(文本,整数等)。

我想知道Solr或ElasticSearch是否可以有效地处理一个字段的大量值,而哪个值做得更好。

那么在这种情况下数百万条记录呢?

在已经有数百万条记录且持​​续增长的情况下,实时索引又如何呢?我了解Solr NRS和ElasticSearch可以进行实时索引编制,但是我不确定我的情况是否带来新的挑战。

感谢您的输入!

干杯!

最佳答案

Solr和ElasticSearch都基于Lucene,后者执行真正的索引/查询/存储文档。因此,就字段和文档的大小而言,两者的性能应该非常相似。

在一个或一个订单之间进行选择可能应该基于您最喜欢使用哪一个订单。例如,ElasticSearch具有用于查询和索引的JSON API,而Solr使用大量XML进行配置和查询。

我认为,如果您要拥有数百万个文档和/或需要在一组机器中划分插入/查询负载,ElasticSearch具有优势,因为它易于分片和创建副本。

关于实时搜索,两者都可能适合您的需求。它们使您可以自定义其“刷新”索引的频率。允许刚刚建立索引的新文档出现在搜索结果中。例如,您可以在ElasticSearch中将刷新设置为每分钟发生一次。

关于search - Solr和ElasticSearch的可伸缩性:5000个值的字段,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16239010/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com