gpt4 book ai didi

lucene - 无需保存数据的 Elasticsearch 引擎

转载 作者:行者123 更新时间:2023-12-02 23:35:09 26 4
gpt4 key购买 nike

Elastic / Lucene真的需要在文档中存储所有索引数据吗?您难道不就通过通过传递数据,以便Lucene may index the words into its hash table并为每个文档都具有一个字段的URL(或对您有意义的指针)返回每个文档的来源?

一个简单的例子就是索引Wikipedia.org。如果我将每个网页传递给Elastic / Lucene进行索引-如果Lucene为每个网页的主要文本建立索引并有相应的URL字段来答复搜索,为什么我需要将每个网页的主要文本保存在字段中?

我们花了很多钱来存储大量冗余数据-我只是想知道为什么Lucene是从哈希表中搜索而不是从实际字段中搜索,所以我们将数据保存到...如果我们不想要,为什么要保存该数据?

有没有一种方法可以在Elastic中索引全文文档而不必保存这些文档中的所有全文数据?

最佳答案

_source字段有很多选项。这是实际存储原始文档的字段。您可以完全禁用它,也可以决定保留哪些字段。可以在文档中找到更多信息:

https://www.elastic.co/guide/en/elasticsearch/reference/current/mapping-source-field.html

关于lucene - 无需保存数据的 Elasticsearch 引擎,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31928414/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com