gpt4 book ai didi

neo4j 导入速度变慢

转载 作者:行者123 更新时间:2023-12-01 07:28:47 27 4
gpt4 key购买 nike

我正在尝试使用 cypher 将大约 500,000 个节点的中等数据集导入到 neo4j 中。我在带 SSD 的 3.4 GHz i7 iMac 上本地运行 neo4j-community-2.0.0-M05。

我将密码通过管道传输到 neo4j shell,将每 40k 行包装到一个事务中。

我正在使用标签,在开始之前,我为每个标签节点的一个属性创建了索引。

当我昨晚离开时,MATCH CREATE UNIQUE 每次大约需要 15 毫秒。今天早上他们花费了大约 6000 毫秒。

慢查询看起来像这样

MATCH n:Artifact WHERE n.pathId = 'ZZZ' CREATE UNIQUE n-[r:DEPENDS_ON]->(a:Artifact {pathId: 'YYY'}) RETURN a
1 row
5719 ms

pathId 已编入索引。

我知道这是一个里程碑版本,可能没有优化性能。但我的导入进度还不到三分之一,而且速度越来越慢。

除了 cypher,我应该看看其他方法来导入这些数据吗?

最佳答案

我只想回答我自己的问题,以防其他人发现这个问题。感谢 Peter 建议批量导入项目。我用了2.0 tree .

我的工作流程最终是 (1) 将所有数据加载到关系数据库中,(2) 清理重复数据,然后 (3) 编写脚本将数据导出到 CSV 文件中。

使用 cypher,我让导入运行了 24 小时,然后才终止它。使用java导入工具,整个导入用neo4j-community-2.0.0-M06耗时11秒。

底线:不要费心尝试写出密码来导入大块数据。如有必要,花一个小时清理数据,然后导出为 CSV 并使用 java 批量导入工具。

关于neo4j 导入速度变慢,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19386260/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com