gpt4 book ai didi

performance - 带索引和不带索引的插入性能

转载 作者:行者123 更新时间:2023-12-04 20:12:41 24 4
gpt4 key购买 nike

做了几个测试。

基于 Wes 等的一些很好的建议,我调整了一些没有缓存的 neo4j 属性,以便在多线程环境中进行大规模插入,并且性能还不错。

但是,当我引入索引(在节点上)时,性能会下降很多。差异很容易达到5倍。是否有配置设置使其更好?

提前致谢,

萨钦

Neo4j 版本 - 1.8.1; JVM - 1.6

最佳答案

将节点(或关系)插入 Lucene 索引的成本很高。 Lucene 是一个强大但复杂的工具,专为全文/关键字搜索而设计。与裸数据库相比,它是相当慢的。

这就是大多数批量插入工具异步进行索引的原因,例如 Michael 的批量插入器:

http://jexp.de/blog/2012/10/parallel-batch-inserter-with-neo4j/

有些甚至绕过事务,或者直接写入存储文件:

http://blog.xebia.com/2012/11/13/combining-neo4j-and-hadoop-part-i/

为了提高性能,使用 SSD 磁盘可能会有所帮助。但由于 Neo4j 是一个完全 ACID 的事务数据库,并且 Lucene 索引与事务紧密耦合(这是一件好事),除了优化基础架构以获得最佳写入性能之外,您无能为力。

关于performance - 带索引和不带索引的插入性能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15372564/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com