- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试以增量模式刷新 Lucene 索引,该模式正在更新已更改的文档并保持其他未更改的文档原样。
为了更新更改的文档,我使用 IndexWriter.deleteDocuments(Query)
删除这些文档,然后使用 IndexWriter.addDocument()
添加更新的文档。
IndexWriter.deleteDocuments
中使用的Query
对象包含大约 12-15 个术语。在刷新索引的过程中,有时我还需要通过使用 IndexWriter.deleteDocuments
删除所有文档然后添加新文档来进行完全刷新。
问题是当我在大约 100000 个文档删除后调用 IndexWriter.flush()
时,执行需要很长时间并抛出 OutOfMemoryError
。如果我禁用刷新,索引会快速上升到 2000000 次文档删除,然后它会抛出 OutOfMemoryError
。我试图将 IndexWriter.setRAMBufferSizeMB
设置为 500 以避免内存不足错误,但没有成功。索引大小为 1.8 GB。
最佳答案
首先。增加 RAM 缓冲区不是您的解决方案。据我所知,它是一个缓存,我宁愿争辩说它正在增加你的问题。 OutOfMemoryError 是一个 JVM 问题,而不是 Lucene 的问题。您可以将 RAM 缓冲区设置为 1TB - 如果您的 VM 没有足够的内存,那么您无论如何都会遇到问题。因此,您可以做两件事:增加 JVM 内存或减少消耗。
其次。您是否已经考虑过增加堆内存设置?刷新需要很长时间的原因是系统在内存用完之前不久进行了大量垃圾收集。这是一个典型的症状。您可以使用 jvisualvm
等工具进行检查。您需要先安装 GC 详细信息插件,然后您可以选择和监控您疯狂的 OutOfMemory 应用程序。如果您了解到您的内存问题,您可以像这样增加最大堆空间:
java -Xmx512M MyLuceneApp (or however you start your Lucene application)
但是,我还是会先使用工具来检查您的内存消耗情况和垃圾回收行为。您的目标应该是避免内存不足,因为这会导致垃圾收集降低您的应用程序的性能。
第三。现在,如果您增加堆,则必须确保您也有足够的 native 内存。因为如果你不这样做(在 Linux 上使用像 top
这样的工具检查)你的系统将开始交换到磁盘,这也会疯狂地打击 Lucene 的性能。因为 Lucene 针对顺序磁盘读取进行了优化,如果您的系统开始交换,您的硬盘将进行大量磁盘寻道,这比顺序读取慢 2 个数量级。所以情况会更糟。
第四。如果你没有足够的内存考虑批量删除。在 1,000 或 10,000 个文件进行冲洗后,然后一次又一次。出现此 OutOfMemoryError 的原因是 Lucene 必须将所有内容保存在内存中,直到您进行刷新。因此,无论如何不允许刷新太大的批处理可能是个好主意,以避免将来出现问题。
关于java - 更新 Lucene 索引中的文档时如何避免 OutOfMemoryErrors?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6956694/
我正在编写一个具有以下签名的 Java 方法。 void Logger(Method method, Object[] args); 如果一个方法(例如 ABC() )调用此方法 Logger,它应该
我是 Java 新手。 我的问题是我的 Java 程序找不到我试图用作的图像文件一个 JButton。 (目前这段代码什么也没做,因为我只是得到了想要的外观第一的)。这是我的主课 代码: packag
好的,今天我在接受采访,我已经编写 Java 代码多年了。采访中说“Java 垃圾收集是一个棘手的问题,我有几个 friend 一直在努力弄清楚。你在这方面做得怎么样?”。她是想骗我吗?还是我的一生都
我的 friend 给了我一个谜语让我解开。它是这样的: There are 100 people. Each one of them, in his turn, does the following
如果我将使用 Java 5 代码的应用程序编译成字节码,生成的 .class 文件是否能够在 Java 1.4 下运行? 如果后者可以工作并且我正在尝试在我的 Java 1.4 应用程序中使用 Jav
有关于why Java doesn't support unsigned types的问题以及一些关于处理无符号类型的问题。我做了一些搜索,似乎 Scala 也不支持无符号数据类型。限制是Java和S
我只是想知道在一个 java 版本中生成的字节码是否可以在其他 java 版本上运行 最佳答案 通常,字节码无需修改即可在 较新 版本的 Java 上运行。它不会在旧版本上运行,除非您使用特殊参数 (
我有一个关于在命令提示符下执行 java 程序的基本问题。 在某些机器上我们需要指定 -cp 。 (类路径)同时执行java程序 (test为java文件名与.class文件存在于同一目录下) jav
我已经阅读 StackOverflow 有一段时间了,现在我才鼓起勇气提出问题。我今年 20 岁,目前在我的家乡(罗马尼亚克卢日-纳波卡)就读 IT 大学。足以介绍:D。 基本上,我有一家提供簿记应用
我有 public JSONObject parseXML(String xml) { JSONObject jsonObject = XML.toJSONObject(xml); r
我已经在 Java 中实现了带有动态类型的简单解释语言。不幸的是我遇到了以下问题。测试时如下代码: def main() { def ks = Map[[1, 2]].keySet()
一直提示输入 1 到 10 的数字 - 结果应将 st、rd、th 和 nd 添加到数字中。编写一个程序,提示用户输入 1 到 10 之间的任意整数,然后以序数形式显示该整数并附加后缀。 public
我有这个 DownloadFile.java 并按预期下载该文件: import java.io.*; import java.net.URL; public class DownloadFile {
我想在 GUI 上添加延迟。我放置了 2 个 for 循环,然后重新绘制了一个标签,但这 2 个 for 循环一个接一个地执行,并且标签被重新绘制到最后一个。 我能做什么? for(int i=0;
我正在对对象 Student 的列表项进行一些测试,但是我更喜欢在 java 类对象中创建硬编码列表,然后从那里提取数据,而不是连接到数据库并在结果集中选择记录。然而,自从我这样做以来已经很长时间了,
我知道对象创建分为三个部分: 声明 实例化 初始化 classA{} classB extends classA{} classA obj = new classB(1,1); 实例化 它必须使用
我有兴趣使用 GPRS 构建车辆跟踪系统。但是,我有一些问题要问以前做过此操作的人: GPRS 是最好的技术吗?人们意识到任何问题吗? 我计划使用 Java/Java EE - 有更好的技术吗? 如果
我可以通过递归方法反转数组,例如:数组={1,2,3,4,5} 数组结果={5,4,3,2,1}但我的结果是相同的数组,我不知道为什么,请帮助我。 public class Recursion { p
有这样的标准方式吗? 包括 Java源代码-测试代码- Ant 或 Maven联合单元持续集成(可能是巡航控制)ClearCase 版本控制工具部署到应用服务器 最后我希望有一个自动构建和集成环境。
我什至不知道这是否可能,我非常怀疑它是否可能,但如果可以,您能告诉我怎么做吗?我只是想知道如何从打印机打印一些文本。 有什么想法吗? 最佳答案 这里有更简单的事情。 import javax.swin
我是一名优秀的程序员,十分优秀!