- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我正在尝试通过使用 py2neo python 模块 (py2neo.cypher.execute) 执行密码命令,将大量节点 (~500,000) 插入到(非嵌入式)neo4j 数据库中。最终我需要删除对 py2neo 的依赖,但我目前正在使用它,直到我了解更多关于 cypher 和 neo4j 的知识。
我有两个节点类型A和B,绝大多数节点都是A类型。有两种可能的关系r1和r2,比如A-[r1]-A和A-[r2]-B。 A 类的每个节点将有 0 - 100 个 r1 关系,B 类的每个节点将有 1 - 5000 个 r2 关系。
目前,我正在通过构建大型 CREATE 语句来插入节点。例如我可能有一个声明
CREATE (:A {uid:1, attr:5})-[:r1]-(:A {uid:2, attr:5})-[:r1]-...
其中 ... 可能是另外 5000 个左右的节点和关系,在图中形成一个线性链。这工作正常,但它很慢。我还使用
索引这些节点CREATE INDEX ON :A(uid)
在添加完所有类型 A 节点后,我再次使用 CREATE 语句添加类型 B 节点。最后,我尝试使用类似
的语句添加 r2 关系MATCH c:B, m:A where c.uid=1 AND (m.uid=2 OR m.uid=5 OR ...)
CREATE (m)-[:r2]->(c)
其中 ... 可以表示几千个 OR 语句。这似乎真的很慢,每秒只添加几个关系。
那么,有没有更好的方法来做到这一点?我在这里完全偏离轨道了吗?我看了this question但这并没有解释如何使用密码来有效地加载节点。我看到的所有其他东西似乎都使用 java,但没有显示可以使用实际的密码查询。
最佳答案
直到最后才创建索引(在 2.0 中)。它会减慢节点创建速度。
您是否在 Cypher 中使用参数?
我想你会损失很多密码解析时间,除非你的密码每次都与参数完全相同。如果您可以将其建模为那样,您将看到显着的性能提升。
您已经在密码请求中发送了相当大的数据 block ,但是批处理请求 API 将允许您发送多个 REST 请求中的一个,这可能会更快(试试吧!)。
最后,如果这是一次性导入,您可以考虑使用批量导入工具——它可以在几分钟内烧毁 500K 个节点,即使在硬件不好的情况下……然后您可以升级数据库文件(我不要认为它可以创建 2.0 文件,但如果不能的话可能很快就会出现),并通过 Cypher 创建标签/索引。
更新:我刚注意到最后的 MATCH 语句。您不应该这样做——一次建立一个关系,而不是对 ID 使用 OR。这可能会有很大帮助——并确保您使用 uid 的参数。 Cypher 2.0 似乎无法使用 OR 进行索引查找,即使您使用索引提示也是如此。也许这会在以后出现。
2013 年 12 月更新:2.0 具有 Cypher 事务端点,我已经看到它的吞吐量有了很大的改进。我已经能够每秒发送 20-30k Cypher 语句,使用 100-200 条语句的“exec”大小,以及总共 1000-10000 条语句的事务大小。对于加速 Cypher 的加载非常有效。
关于python - 使用密码将节点插入 neo4j 数据库的最有效方法是什么,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16952024/
我已经在 OSX 上安装了 Docker 并下载了 neo 镜像。当我运行它时(使用图像主页中的 args),一切似乎都正常,但日志的最后几行表明如下: 00:20:39.662 [main] INF
我的正则表达式在 neos 项目中不能正常工作。DD/MM/YYYY 的正则表达式(仅限 19XX-20XX) var date_regex = /^(0[1-9]|1\d|2\d|3[01])\/(
Neo 4j可以与HDFS / Hadoop集成吗?在处理涉及许多关系且每秒具有大量事务的大型数据集时,通常使用Hadoop来提高Neo 4j的处理能力。 最佳答案 这是一个非常广泛的问题。也许考虑提
我尝试在 NEO 环境中使用 TenantAccessor。TenantAccessor.getCurrentTenant().getTenantId() 生成的 TenantId 作为 GUID 返
我下载了Neoclipse Source并下载了 Neo4J source 。但是 Neo4J 源文件中找不到 Neoclipse 源文件引用的某些类。它们已被弃用吗?我可以获得 Neoclipse
进程文件: neo or neo.exe 进程名称: Price Patrol 进程类别:存在安全风险的进程 英文描述: neo.exe is the execuatble for Pric
load csv with headers from 'file:///C:/Users/user/Desktop/Neo4J' as row Create (:State_Code {state_c
如何在 SAPUI5 应用程序的运行时为 neo-app.json 文件的 routes 部分定义新条目?例如在 Component.js 内部。 例如,我想将以下条目添加到文件中,或者将一些代码添加
我最近将一台计算机变成了 Ubuntu 服务器。我已经按照下面的文章 http://neos.readthedocs.io/en/stable/GettingStarted/Installation.
我正在尝试了解如何使用 NEOS Server for SCIP .我已经阅读了有关 CPLEX LP file format 的教程.但我仍然得不到任何结果。 让我们以该教程中提供的示例为例: Ma
关于这一年Bubble Cup (完)有问题NEO (我无法解决),它要求 给定一个包含 n 个整数元素的数组。我们把它分成几个部分(可能是1个),每个部分都是一个连续的元素。这种情况下的 NEO 值
我的 Rails 应用程序必须使用 Neo4j。所以我开始安装 neo4j 服务器。我按照步骤安装 here在 Linux 上。 但是当我运行的时候 ./bin/neo4j console 它给了 E
我刚从 windows 10 切换到 arch linux我想使用 (Neo)Vim 作为我的代码编辑器我已经完成了自动编译和模糊查找器但我不知道如何在 (Neo)Vim 中调试 任何帮助! 最佳答案
我想问一下,如何使用Spring boot找到Dijkstra。 我目前使用 spring-boot-starter-data-neo4j 库将 Neo4j 与我的 java 类映射。 我现在想使用
我正在尝试创建一个可以从 U2F token (例如 Java 语言的 Yubikey Neo)检索公钥和私钥的应用程序。我尝试在控制台中使用简单的扫描仪从 Yubikey Neo 获取任何内容,但它
我想用摩托罗拉68000汇编器写一个程序,目标平台是Neo Geo(九十年代的游戏机);这个问题很严重,我有一个我想实现的特定项目并且我有编程经验(虽然我现在主要是 Perl/R 编程,但我以前只接触
我使用自定义 Web 服务作为 neo4j 的非托管扩展。 这是 Neo4j 提供的详细信息,我已遵循该详细信息并创建了自己的非托管扩展。 http://neo4j.com/docs/stable/s
Typo3 Neos 是否原生支持元素的响应行为?例如像 css 网格类(col-sm-?? 或 col-md-??)这样的 Bootstrap ,或者我可以使用 Neos 通过 hidden-xs
我是为嵌入式板构建自定义 Linux 操作系统的新手 - 所以请忽略我的无知。 我有一个名为 NanoPi NEO 的开发板,它具有定制的 Debian Linux。现在开发板附带一个 .img 文件
我正在尝试使用脚本在 NEO4j db 中导入 csv 文件: LOAD CSV FROM "file:///dataframe6.txt" AS line RETURN count(*) 但我收到以
我是一名优秀的程序员,十分优秀!