gpt4 book ai didi

java - 使用 Lucene 索引 zip 文件

转载 作者:行者123 更新时间:2023-12-01 14:50:45 28 4
gpt4 key购买 nike

是否可以在 lucene 中索引压缩文件夹。如果我解压它,内容太大。如果我只是索引一堆包含文本文件的压缩文件夹,搜索无法正常工作。lucene 是否可以在不解压 zip 文件的情况下建立索引。

最佳答案

Lucene 只是一个搜索库,它不可能“知道”所有可能的场景 - 例如如何索引 XML 文档、word 文件、.zip 内的文件、切尔诺贝利核电站创建的文件等。

但是 Lucene 提供了什么 the API以便您将数据挂接到 Lucene。

如果无法解压缩存档文件的内容,您可以编写一个类 reads the zip file (但不会将其解压到磁盘上)并将这些数据输入 Lucene。

如果您主要关心的是索引的大小,那么您无能为力来减少它。不过有一些提示:

  • 尝试不使用停用词建立索引
  • 不存储字段,仅索引它们(提示:Field.Store.NO)
  • 始终将所有术语小写以减少术语数量

关于java - 使用 Lucene 索引 zip 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14888979/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com