java - 将文档添加到索引后忘记关闭 Lucene IndexWriter-6ren

java - 将文档添加到索引后忘记关闭 Lucene IndexWriter

转载作者：搜寻专家更新时间：2023-11-01 03:13:02

24

4

我有一个程序运行了 2 天，为大约 1.6 亿个文本文件建立了一个 Lucene 索引，程序结束后，我尝试搜索索引，发现索引没有正确建立，indexReader.numDocs() 返回 0 .我检查了索引目录，看起来不错，所有索引数据似乎都在那里，目录大小为1.5 GB。

我检查了我的代码，发现我忘记调用 indexWriter.optimize() 和 indexWriter.close()，我想知道是否可以重新优化() 索引所以我不需要重建整个索引从头开始？我真的不希望该程序再花 2 天时间。

最佳答案

调用 IndexWriter.optimize() 不是必需的，可以在稍后通过重新打开索引调用。它只是优化索引中的文档以获得更好的读取性能，并且不会影响任何其他内容。

但是，如果您忘记调用 IndexWriter.close()，那么您的索引可能不完整。由于您处理了如此多的文档，它可能会刷新其中的大部分文档，因此希望您只需要重新索引最后一个文档。使用 Luke按照 UI 的建议快速浏览索引以查看其所处的状态。

关于java - 将文档添加到索引后忘记关闭 Lucene IndexWriter，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/5374419/

24

4

0

文章推荐： java - 为什么原始代码和编译代码之间存在差异

文章推荐： c# - 创建 XML 文档的最佳 .net 方法

文章推荐： c# - 该进程无法访问该文件，因为它正被另一个进程使用

文章推荐： java - 使用接口(interface)和类的多态性

java - @Singleton @ApplicationScoped bean 中的 Lucene IndexWriters 关闭 IndexWriter
当文档根据 Java Web 应用程序中的内容上传到不同的索引时，我需要对文档进行索引，其中多个用户可以同时上传多个文档我使用 Lucene 6.2.1 进行索引为此我创建了一个无状态 EJB。它
java - 获取 IndexWriter 上待处理更改的数量
我们有基于 Lucene 的本土搜索服务。我前段时间遇到的一个特殊问题是获取 IndexWriter 上待处理更改的数量。如果挂起的更改计数器为零，则无需提交索引，重新打开 IndexReader、I
java - Lucene Indexwriter 目标文件夹
我正在开发一个小型 lucene 项目，我必须在其中索引一堆文本文件。我想到目前为止我已经成功创建了索引。代码运行，我得到一堆名为 0_.* fdt/fdx/fnm 等的文件。我想知道的是，我可以选
java - IndexWriter.commit() 不足以更改索引
我刚刚将我们的 Lucene 实现从 3.1 移植到 4.9，如果没有 forceMerge(1) (曾经是优化的)，我似乎仍然无法更新索引中的文档。据我了解，每当我更新文档时，旧文档都会被标记为已删
java - Lucene - 打开一个关闭的 IndexWriter
这是我的问题，我执行 add() 将文档添加到我的索引，然后我关闭它。效果很好! 现在我有一个新需求，每次我在我的数据库中保存一些东西时，我都需要更新我的索引。我无法再次创建 indexWriter，
java - 将文档添加到索引后忘记关闭 Lucene IndexWriter
我有一个程序运行了 2 天，为大约 1.6 亿个文本文件建立了一个 Lucene 索引，程序结束后，我尝试搜索索引，发现索引没有正确建立，indexReader.numDocs() 返回 0 .我检查
c# - Lucene IndexWriter 添加文件慢
我写了一个小循环，将 10,000 个文档添加到 IndexWriter 中，这花了很长时间。还有其他方法可以索引大量文档吗？我问是因为当它上线时它必须加载 15,000 条记录。另一个问题是如
java - Lucene : IndexWriter. 更新 - 如何形成搜索数值的术语
我的索引有以下字段:ID(长整型、已索引、已存储、未分析)、内容(字符串、未索引、未分析、已存储)和标签(字符串、已索引、已分析、已存储)。需要更新给定 ID 的内容 - 如何使用 IndexW
java - Lucene IndexWriter OutOfMemory 异常
我在一个目录中有两个大文件(约 200 MB)，想在它们上建立索引，所以这是我的代码: public class LuceneUtil { private void indexDoc(In
search - Indexwriter 类中的 Forcemerge 函数
我想了解 Solr3.5.0 中 IndexWriter 类中的一个函数。任何人都可以让我知道 forceMerge() 函数到底做了什么。它是否优化了分割？谢谢，杰亚普拉卡什最佳答案是的，f
lucene - Lucene IndexWriter.ExpungeDeletes() 所需的可用磁盘空间量
我正在编写一个使用 Lucene 索引的应用程序，用户必须在其中使用经常更新或删除索引的文档。我知道如果有人想从 Lucene 索引中永久删除标记为删除的文档，那么他有两个选择: Indexwri
java - 使用 lucene IndexWriter 进行多线程处理
我正在使用 lucene 6.3.0 创建索引器。它从一个文件夹读取集合并创建另一个文件夹的索引。这工作正常，但我想进行多线程处理，我的意思是，给定 2 个集合(c1 和 c2)，运行 2 个线程，每
java - new IndexWriter() 处的 LockObtainFailedException
我正在使用 Crawler Controller 来抓取中型网站的所有页面。它随机抓取 2-3 个页面，然后导致 IndexWriter 上的锁定 Directory dir = FSDirector
c# - Lucene.Net IndexWriter 无法加载文件错误？
我正在使用 lucene.net 在 vs 代码中构建一个 .net 核心 mvc 应用程序，每当我尝试运行这段代码时，它都会抛出一个异常提示(是的，索引路径确实存在) 未处理的异常:System.T
.net - Lucene .NET IndexWriter DeleteDocuments 不工作
这是代码: Try Dim util As New IndexerUtil() Dim dir As Lucene.Net.Store.Directory = FSDi
lucene - 如何检查 Lucene IndexWriter 实例是否有效/打开？
对不起，这个简单的问题，但似乎没有任何明显的方法。根据文档，建议保留 IndexWriter 的单个实例。在内存中可以一次又一次地用于更新，而不是为每次更改打开和关闭一个(成本更高)。但是，文档还指
c# - Lucene.NET - 无法使用 IndexWriter 删除文档
我正在接手一个项目，所以我还在学习这个。该项目使用 Lucence.NET。我也不知道这个功能是否正确。不管怎样，我正在实例化: var writer = new IndexWriter(direct
c# - Lucene .Net，我需要关闭 IndexWriter 吗
我们遇到了 Lucene .Net 抛出 LockObtainFailedException 的锁定问题。这是一个 Multi-Tenancy 站点，每个客户在磁盘上都有自己的物理搜索索引，并使用 I
java - Lucene Java 打开太多文件。我是否正确使用了 IndexWriter？
我的 Lucene Java 实现占用了太多文件。我按照 Lucene Wiki 中有关打开文件太多的说明进行操作，但这只会帮助减缓问题的发生。这是我将对象 (PTicket) 添加到索引的代码: /
c# - 在每次调用中重用或创建 Analyzer、IndexSearcher、IndexWriter 哪个更好？
我是 Lucene.net 新手，正在努力适应 search code from here这实际上在每个方法中创建了一个新的 Analyzer、IndexSearcher 和 IndexWriter

首页

博学

6Ren·AI

商城

java - 将文档添加到索引后忘记关闭 Lucene IndexWriter