gpt4 book ai didi

java - 索引属性文件

转载 作者:行者123 更新时间:2023-12-02 08:37:40 25 4
gpt4 key购买 nike

我需要对大量 Java 属性和 list 文件建立索引。

文件中的数据只是键值对。

我正在考虑使用 Lucene 来实现此目的。

但是,我不需要任何真正的全文搜索功能,因为数据非常结构化。我只需要搜索属性值的精确匹配,并且属性键始终是已知的。不需要标记化,也没有“默认”字段。唯一属性键的数量可能非常大。

我还应该补充一点,我希望能够将索引完全保存在内存中(在 Lucene 中,这将是一个 RAMDirectory)。

那么,Lucene(主要是一个全文搜索引擎)仍然是一个很好的匹配,还是有其他更好的选择?

更新:一个简单的 HashMap 是不行的,因为我想找到将属性 A 定义为值 B 的文件。它至少需要是一个嵌套的 HashMap 来保存三元组( Key 、 Value 、 Filename )。

最佳答案

是的,每个键都有一个非标记化字段的 Lucene 索引就可以解决这个问题。这也有点矫枉过正,某种 Map 结构可能足以满足您所描述的内容。

这里使用 Lucene 的主要好处是它将细节抽象为一个相当简单的 API。

关于java - 索引属性文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1031673/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com