gpt4 book ai didi

elasticsearch - 空字段对Lucene索引有害吗?

转载 作者:行者123 更新时间:2023-12-03 01:50:47 25 4
gpt4 key购买 nike

ES doc on mappings状态如下

Types are not as well suited for entirely different types of data. If your two types have mutually exclusive sets of fields, that means half your index is going to contain "empty" values (the fields will be sparse), which will eventually cause performance problems. In these cases, it’s much better to utilize two independent indices.



我想知道我应该多严格。

假设我有三种类型的文档,每种文档共享相同的60-70%的字段,而其余的对于每种类型都是唯一的。

是否应将每种类型放在单独的索引中?
还是一个索引也可以,这意味着不会有大量的存储浪费,也不会在搜索或索引操作上造成任何明显的性能下降吗?

基本上,我正在寻找任何信息来确认或反对上述报价。

最佳答案

如果您的类型重叠60-70%,则ES会很好,这听起来根本不是“互斥”的。注意:

  • 在ES的 future 版本中,事物将为improve
  • 如果不需要它们,可以按照建议的方式禁用规范和doc_values here
  • 关于elasticsearch - 空字段对Lucene索引有害吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40601699/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com