- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我打开这个讨论是因为谷歌搜索了 Lucene.Net 的使用,但我没有发现任何真正有用的东西。问题很简单:我在构建和更新 Lucene.Net 索引时遇到问题。特别是即使我将 SetRAMBufferSizeMB 固定为 256,将 SetMergeFactor 固定为 100 并将 SetMaxMergeDocs 固定为 100000,它的内存使用量仍在不断增长。此外,每次使用索引时我都会仔细使用 Close() 和 Commit() 方法。
为了使 lucene.Net 适用于我的数据,我从本教程开始:http://www.lucenetutorial.com/lucene-in-5-minutes.html
对于 10^5 和 10^6 的文档,似乎需要 1.8GB 的内存。因此,如果实际 RAM 使用量是 7 倍,为什么还要设置 SetRAMBufferSizeMB 参数?有谁真的知道如何限制内存使用量?
此外,我发现要处理 10^5 或 10^6 的文档,必须为 x64 平台编译 Lucene.Net。事实上,如果我为 x86 平台编译代码,索引崩溃会系统地触及 1.2GB 的 RAM。有没有人能够使用更少的 RAM 索引相同数量(甚至更多)的文档?在哪个硬件和软件设置中?我的环境配置如下:- 操作系统 := win7 32/64 位。- sw := .Net 框架 4.0- hw := 12 核 Xeon 工作站,6GB 内存。- Lucene.Net rel.:2.9.4g(当前稳定)。- Lucene.Net目录类型:FSDirectory(索引写入磁盘)。
好的,我根据您关于重新使用文档/字段实例的建议测试了代码,但是代码在内存使用方面的表现完全相同。在这里,我针对在 1000000
文档的索引过程中跟踪的一些参数发布了一些调试行。
DEBUG - BuildIndex – IndexWriter - RamSizeInBytes 424960B; index process dimension 1164328960B. 4% of the indexing process.
DEBUG - BuildIndex – IndexWriter - RamSizeInBytes 457728B; index process dimension 1282666496B. 5% of the indexing process.
DEBUG - BuildIndex – IndexWriter - RamSizeInBytes 457728B; index process dimension 1477861376B. 6% of the indexing process.
索引过程维度获取方式如下:
很容易观察到进程在 RAM
中的增长速度(~1.5GB
在 6%
的索引进程中)甚至如果 IndexWriter
使用的 RAM
缓冲区或多或少没有变化。因此,问题是:是否可以显式限制索引进程大小的 RAM
使用?我不在乎在搜索阶段性能是否下降以及我是否必须等待一段时间才能完成索引,但我需要确保索引过程不会遇到 OOM
或索引大量文档时发生堆栈溢出错误。如果无法限制内存使用量,我该怎么做?
为了完整起见,我发布了用于调试的代码:
// get the current process
Process currentProcess = System.Diagnostics.Process.GetCurrentProcess();
// get the physical mem usage of the index writer
long totalBytesOfIndex = writer.RamSizeInBytes();
// get the physical mem usage
long totalBytesOfMemoryUsed = currentProcess.WorkingSet64;
最佳答案
终于,我找到了错误。它包含在 ItalianAnalyzer(意大利语分析器)中,该分析器是利用 Luca Gentili 的贡献构建的 (http://snowball.tartarus.org/algorithms/italian/stemmer.html)。事实上,在 ItalianAnalyzer 类中,一个包含停用词的文件被打开了几次,并且在每次使用后都没有关闭。这就是我出现 OOM 问题的原因。解决此错误 Lucene.Net 在构建索引和搜索方面都是光速的。
关于optimization - 写入 Lucene.Net 索引时内存使用量不断增长,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12111528/
增长,则让
当我输入内容时,如何移动 p 段落下方的所有元素,即 contenteditable。 这是我的代码: body, html { margin: 0; padding: 0; backgr
我要解决的问题: 我有一个包含 div 的外部 div。 content 内部和外部 div 之间的边距应始终相同。 当内部 div 增长/收缩时,外部 div
这document Ulrich Drepper 称为“图书馆设计、实现和维护的良好实践”(第 5 页底部): [...] the type definition should always crea
有什么方法可以获取 QPainterPath 并将其展开,就像 Photoshop 中的“选择”>“增长...”(或“展开...”)命令一样? 我想获取从 QGraphicsItem::shape 返
假设,为了问题的目的,我们有一个内存池,最初分配了 n 个 block 。但是,当达到容量时,池想要增长并变成原来大小的两倍 (2n)。 现在可以使用 C 中的 realloc 完成此调整大小操作,但
假设,为了问题的目的,我们有一个内存池,最初分配了 n 个 block 。但是,当达到容量时,池想要增长并变成原来大小的两倍 (2n)。 现在可以使用 C 中的 realloc 完成此调整大小操作,但
我正在研究 boost 库的共享内存部分,为更大的项目做准备。我需要一个共享内存段,在初始化时我不一定知道它的大小,所以我的计划是增加这个段。 我的初始实现有一个存储在共享内存中的 boost::in
这个问题在这里已经有了答案: How to disable equal height columns in Flexbox? (4 个答案) What are the differences bet
我有一个包含子表的表。我不希望子表影响表格的宽度——在溢出的情况下,我希望两者独立滚动。此外,由于子表是基于切换显示的,所以我不希望主表行根据子表是否可见而跳转 Here's代码笔。 我想我可以用 t
我有一个带栏的页面设计,它可以有一个、两个或三个栏。这些列的大小应相同。 为此我使用了 flexbox,它很好,允许我添加/删除我的列并让浏览器处理列宽的大小调整。 现在,当列中的文本大于列的宽度时,
要求: 我需要根据数据增长一个任意大的数组。 我可以猜测大小(大约 100-200),但不能保证数组每次都能适合 一旦它增长到最终大小,我需要对其执行数值计算,因此我更愿意最终得到一个二维 numpy
我有一个 3x256 规则的规则集。每个规则映射到一个 3x3 的值网格,这些值本身就是规则。 规则示例: 0 -> [[0,0,0],[0,1,0],[0,0,0]] 1 -> [[1,1,1],
我有 3 个 div,如果我给前两个 div flex: 0.5,如果我给了 flex-wrap: wrap,最后一个 div 应该移动到下一行>。如果我错了,请指正。 以下是我的 html/css:
在文档和 Bootstrap v4 问题中 (here) ,我看不到任何支持 flex-grow 的计划,例如语法如下: I use all the space lef
要求: 我需要从数据中增加一个任意大的数组。 我可以猜测大小(大约 100-200),但不能保证每次都适合数组 一旦它增长到最终大小,我需要对其执行数值计算,因此我希望最终得到一个二维 numpy 数
我知道(并在互联网上阅读-包括此资源)。增加内存的逻辑是:如果len数组小于1024-golang将array乘以2,否则将len乘以1.25(并且我们在源代码中看到了这个问题https://gith
当输入长文本时,WPF TextBox 控件会增长。 这个问题已经在 Stackoverflow 中提出了 我也引用了一些答案,但我仍然没有找到有效的正确答案。 Here提到了同样的问题,但没有针对此
我在使用 Vaadin HorizonalLayout 时遇到问题 - 我希望左侧组件填充大部分水平空间,如 Fiddle 所示 但是,当我运行 Vaadin 应用程序时,这两个组件会平分屏幕。
关于这个fiddle , 当我点击 a href在这种情况下这是一个图像,我希望图像从 div 开始增长/过渡以通过过渡/缩放填充整个页面它被放置在其中。如果这不可能,我想用 div 的背景颜色填充页
关闭。这个问题需要更多focused .它目前不接受答案。 想改进这个问题吗? 更新问题,使其只关注一个问题 editing this post . 关闭 6 年前。 Improve this q
我是一名优秀的程序员,十分优秀!