java - 如何提高 Neo4j 2.0 cypher/ExecutionResult 在重负载下的性能？-6ren

java - 如何提高 Neo4j 2.0 cypher/ExecutionResult 在重负载下的性能？

转载作者：行者123 更新时间：2023-12-01 13:41:17

背景:我们注意到，随着并发线程数量的增加，从 ExecutionResult 检索数据时性能会下降。我们的生产应用程序有 200 个工作线程，在嵌入式模式下使用 Neo4j 2.0.0 Community。例如以毫秒为单位。

线程:1，加密时间:0，提取时间:188
线程:10，加密时间:1，提取时间:188
线程:50，加密时间:1，提取时间:2481
线程:100，加密时间:1，提取时间:4466

程序输出示例(过滤 1 个线程的结果):

2013-12-23 14:39:31,137 [main] INFO  net.ahm.graph.CypherLab  - >>>>>>>>>>>>>>>>>>>>>>>>>>>>> NUMBER OF PARALLEL CYPHER EXECUTIONS: 1
2013-12-23 14:39:31,137 [main] INFO  net.ahm.graph.CypherLab  - >>>> STARTED GRAPHDB
2013-12-23 14:39:39,203 [main] INFO  net.ahm.graph.CypherLab  - >>>> CREATED NODES
2013-12-23 14:39:43,510 [main] INFO  net.ahm.graph.CypherLab  - >>>> WARMED UP
2013-12-23 14:39:43,510 [pool-1-thread-1] INFO  net.ahm.graph.CypherLab  - >>>> CYPHER TOOK: 0 m-secs
2013-12-23 14:39:43,698 [pool-1-thread-1] INFO  net.ahm.graph.CypherLab  - >>>> GETTING RESULTS TOOK: 188 m-secs
2013-12-23 14:39:43,698 [pool-1-thread-1] INFO  net.ahm.graph.CypherLab  - >>>> CYPHER RETURNED ROWS: 50000
2013-12-23 14:39:43,698 [Thread-4] INFO  net.ahm.graph.CypherLab  - ### GRAPHDB SHUTDOWNHOOK INVOKED !!!



2013-12-23 14:40:10,470 [main] INFO  net.ahm.graph.CypherLab  - >>>>>>>>>>>>>>>>>>>>>>>>>>>>> NUMBER OF PARALLEL CYPHER EXECUTIONS: 10
...
2013-12-23 14:40:23,985 [pool-1-thread-1] INFO  net.ahm.graph.CypherLab  - >>>> CYPHER TOOK: 1 m-secs
2013-12-23 14:40:25,219 [pool-1-thread-1] INFO  net.ahm.graph.CypherLab  - >>>> GETTING RESULTS TOOK: 188 m-secs
2013-12-23 14:40:25,219 [pool-1-thread-1] INFO  net.ahm.graph.CypherLab  - >>>> CYPHER RETURNED ROWS: 50000
2013-12-23 14:40:25,234 [Thread-4] INFO  net.ahm.graph.CypherLab  - ### GRAPHDB SHUTDOWNHOOK INVOKED !!!


2013-12-23 14:41:28,850 [main] INFO  net.ahm.graph.CypherLab  - >>>>>>>>>>>>>>>>>>>>>>>>>>>>> NUMBER OF PARALLEL CYPHER EXECUTIONS: 50
...
2013-12-23 14:41:41,781 [pool-1-thread-1] INFO  net.ahm.graph.CypherLab  - >>>> CYPHER TOOK: 1 m-secs
2013-12-23 14:41:45,720 [pool-1-thread-1] INFO  net.ahm.graph.CypherLab  - >>>> GETTING RESULTS TOOK: 2481 m-secs
2013-12-23 14:41:45,720 [pool-1-thread-1] INFO  net.ahm.graph.CypherLab  - >>>> CYPHER RETURNED ROWS: 50000
2013-12-23 14:41:46,855 [Thread-4] INFO  net.ahm.graph.CypherLab  - ### GRAPHDB SHUTDOWNHOOK INVOKED !!!


2013-12-23 14:44:09,267 [main] INFO  net.ahm.graph.CypherLab  - >>>>>>>>>>>>>>>>>>>>>>>>>>>>> NUMBER OF PARALLEL CYPHER EXECUTIONS: 100
...
2013-12-23 14:44:22,077 [pool-1-thread-1] INFO  net.ahm.graph.CypherLab  - >>>> CYPHER TOOK: 1 m-secs
2013-12-23 14:44:30,915 [pool-1-thread-1] INFO  net.ahm.graph.CypherLab  - >>>> GETTING RESULTS TOOK: 4466 m-secs
2013-12-23 14:44:30,915 [pool-1-thread-1] INFO  net.ahm.graph.CypherLab  - >>>> CYPHER RETURNED ROWS: 50000
2013-12-23 14:44:31,680 [Thread-4] INFO  net.ahm.graph.CypherLab  - ### GRAPHDB SHUTDOWNHOOK INVOKED !!!

测试程序:

package net.ahm.graph;

import java.io.File;
import java.util.Map;
import java.util.concurrent.CountDownLatch;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;
import java.util.concurrent.TimeUnit;

import org.apache.log4j.Logger;
import org.neo4j.cypher.javacompat.ExecutionEngine;
import org.neo4j.cypher.javacompat.ExecutionResult;
import org.neo4j.graphdb.DynamicLabel;
import org.neo4j.graphdb.GraphDatabaseService;
import org.neo4j.graphdb.Node;
import org.neo4j.graphdb.RelationshipType;
import org.neo4j.graphdb.Transaction;
import org.neo4j.graphdb.factory.GraphDatabaseFactory;
import org.neo4j.graphdb.factory.GraphDatabaseSettings;
import org.neo4j.graphdb.schema.IndexDefinition;
import org.neo4j.graphdb.schema.Schema;
import org.neo4j.kernel.impl.util.FileUtils;
import org.neo4j.kernel.impl.util.StringLogger;

public class CypherLab {
    private static final Logger LOG = Logger.getLogger(CypherLab.class);
    private final static int CONCURRENCY = 100;

    public static void main(String[] args) throws Exception {
        FileUtils.deleteRecursively(new File("graphdb"));
        final GraphDatabaseService graphDb = new GraphDatabaseFactory().newEmbeddedDatabaseBuilder("graphdb")
                .setConfig(GraphDatabaseSettings.use_memory_mapped_buffers, "true").setConfig(GraphDatabaseSettings.cache_type, "strong")
                .newGraphDatabase();
        registerShutdownHook(graphDb);
        LOG.info(">>>>>>>>>>>>>>>>>>>>>>>>>>>>> NUMBER OF PARALLEL CYPHER EXECUTIONS: " + CONCURRENCY);
        LOG.info(">>>> STARTED GRAPHDB");
        createIndex("Parent", "name", graphDb);
        createIndex("Child", "name", graphDb);
        try (Transaction tx = graphDb.beginTx()) {
            Node parent = graphDb.createNode(DynamicLabel.label("Parent"));
            parent.setProperty("name", "parent");
            for (int i = 0; i < 50000; i++) {
                Node child = graphDb.createNode(DynamicLabel.label("Child"));
                child.setProperty("name", "child" + i);
                parent.createRelationshipTo(child, RelationshipTypes.PARENT_CHILD);
            }
            tx.success();
        }
        LOG.info(">>>> CREATED NODES");
        final ExecutionEngine engine = new ExecutionEngine(graphDb, StringLogger.SYSTEM);
        for (int i = 0; i < 10; i++) {
            try (Transaction tx = graphDb.beginTx()) {
                ExecutionResult result = engine.execute("match (n:Parent)-[:PARENT_CHILD]->(m:Child) return n.name, m.name");
                for (Map<String, Object> row : result) {
                    assert ((String) row.get("n.name") != null);
                    assert ((String) row.get("m.name") != null);
                }
                tx.success();
            }
        }
        LOG.info(">>>> WARMED UP");
        ExecutorService es = Executors.newFixedThreadPool(CONCURRENCY);
        final CountDownLatch cdl = new CountDownLatch(CONCURRENCY);
        for (int i = 0; i < CONCURRENCY; i++) {
            es.execute(new Runnable() {
                @Override
                public void run() {
                    try (Transaction tx = graphDb.beginTx()) {
                        long time = System.currentTimeMillis();
                        ExecutionResult result = engine.execute("match (n:Parent)-[:PARENT_CHILD]->(m:Child) return n.name, m.name");
                        LOG.info(">>>> CYPHER TOOK: " + (System.currentTimeMillis() - time) + " m-secs");
                        int count = 0;
                        time = System.currentTimeMillis();
                        for (Map<String, Object> row : result) {
                            assert ((String) row.get("n.name") != null);
                            assert ((String) row.get("m.name") != null);
                            count++;
                        }
                        LOG.info(">>>> GETTING RESULTS TOOK: " + (System.currentTimeMillis() - time) + " m-secs");
                        tx.success();
                        LOG.info(">>>> CYPHER RETURNED ROWS: " + count);
                    } catch (Throwable t) {
                        LOG.error(t);
                    } finally {
                        cdl.countDown();
                    }
                }
            });
        }
        cdl.await();
        es.shutdown();
    }

    private static void createIndex(String label, String propertyName, GraphDatabaseService graphDb) {
        IndexDefinition indexDefinition;
        try (Transaction tx = graphDb.beginTx()) {
            Schema schema = graphDb.schema();
            indexDefinition = schema.indexFor(DynamicLabel.label(label)).on(propertyName).create();
            tx.success();
        }
        try (Transaction tx = graphDb.beginTx()) {
            Schema schema = graphDb.schema();
            schema.awaitIndexOnline(indexDefinition, 10, TimeUnit.SECONDS);
            tx.success();
        }
    }

    private static void registerShutdownHook(final GraphDatabaseService graphDb) {
        Runtime.getRuntime().addShutdownHook(new Thread() {
            @Override
            public void run() {
                LOG.info("### GRAPHDB SHUTDOWNHOOK INVOKED !!!");
                graphDb.shutdown();
            }
        });
    }

    private enum RelationshipTypes implements RelationshipType {
        PARENT_CHILD
    }
}

最佳答案

当这个 commit is merged in 时应该会更好。将作为 2.0.1 的一部分发布还有一些其他较小的瓶颈。

您可以尝试将您的网络服务器线程限制为核心数倍(或核心数 * 2)吗？看看这是否有帮助？

我的理解是，在预热并将热数据集放入缓存后，它仅受 CPU 限制，而不再受 I/O 限制以进行读取。因此，线程过多会导致 CPU 和工作人员挨饿。

如果我使用 8 个和 100 个内核运行测试，我会得到这些用于执行查询并获取 50k 结果的分布:

8 个线程:50% 百分位为 500 毫秒，90% 为 650 毫秒
100 个线程:2600 毫秒的 50% 百分位数和 6000 毫秒的 90%

代码和详细直方图:https://gist.github.com/jexp/a164f6cf9686b8125872

关于java - 如何提高 Neo4j 2.0 cypher/ExecutionResult 在重负载下的性能？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/20750741/

文章推荐： java - JFreeChart 未更新

文章推荐： java - 如何从.jar源代码内部获取文件路径

文章推荐： java - Quick-Json 反序列化转换问题

java - 如何从概念上计算服务器可以服务的最大并发请求/负载？
在 Web 应用程序架构设计期间，我必须从概念上计算我的服务器之一可以服务多少个当前客户端。然后我可以预算它。那么，有什么公式可以遵循吗？或者，你如何计算这个？或者，通常，一个 httpd/tomc
testing - 负载、并发用户测试工具选择建议
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。要求我们推荐或查找书籍、工具、软件库、教程或其他场外资源的问题对于 Stack Overflow 来说是
背景图像上的 Angular (负载)
我正在使用 Angular 5，我正在尝试在加载 div 的背景图像时获取加载图标。如果它是一个普通的 img，我对此没有问题，但如果我尝试将它作为背景，它就不起作用。这里是一些示例代码 app.
我的程序的 CPU 负载
我们怎么知道我们的程序在 CPU 上有多少负载？我尝试使用 htop 找到它。但是 htop 不会给 cpu 负载。它实际上给出了我程序的 cpu 利用率(使用 pid)。我正在使用 C 编程，L
oracle - 为什么Oracle的Spark查询(负载)与SQOOP相比这么慢？
我们发现从Spark 1.3到当前的Spark 2.0.1以来，从Oracle数据库使用Spark的API加载数据一直很慢。典型的代码在Java中是这样的: Map options =
erlang - 如何监控 mnesia 负载？
我有时会收到 mnesia overloaded主要使用时的错误消息 async_dirty查询和 ram_copies表。所以为了了解发生了什么，我想获得更多关于 mnesia 状态的信息，例如每秒
c - 周期性高内核 CPU 负载？
对于通常使用很少 CPU 的程序来说，内核 CPU 非常高。 Linux 机器在状态之间交替。大多数时候，程序使用低 CPU 正常执行。在 CPU“激增”期间，程序使用 100% 可用 CPU 使用高
youtube - 路由数据时流式传输与文件下载的 CPU 负载
我正在使用 Raspberry Pi 2 来路由 wifi-eth 连接。因此，从 eth 方面来看，我有一台可以使用 Pi wifi 连接到互联网的计算机。在 Raspberry 上我启动 htop
javascript - 测量页面负载和 iframe 负载
基本上我有一个网页，其中有一个 iframe 可以从不同的域加载另一个网页。它移动得很慢，我想证明整个页面很慢只是因为 iframe 内的页面。有什么方法可以测量总页面负载以及总页面负载中有多少%来
java - 性能/负载/压力测试编排层
我们有一个基于 Spring 的应用程序，它充当使用其他 Rest API 的编排层。我只想测试这个组件的性能，而不测试正在使用的下游 api。我正在寻找有关如何完成此操作的任何架构建议？当前的方
java - hibernate : session .负载
我正在学习 hibernate 。为了进行测试，我使用无效 key 调用了 session.load 。当我在调试器(JB Idea)中跨过该行后，没有任何反应 - 我预计会得到 ObjectNotF
jquery - 数据属性与 AJAX 负载
我正在开发一个小型的待办事项 PHP 应用程序。我正在使用 jQuery 构建 HTML。其中一个是一个按钮，用于启动一个模式，允许用户编辑该项目。我很好奇加载数据时更好的方法是什么: 1) 在初始加
javascript - 负载 Angular 延迟
我尝试在 twitch 播放器中使用 angular 作为覆盖标记。我将 ng-repear 与(键，值)结合使用。 //player is here 设置是一个全局对象。但是当我尝试加载页面
C 进程相对于内核的 CPU 负载
我即将了解 C 语言中的特定进程如何在特定时间范围内加载 CPU。该进程可能会在运行时切换处理器核心，因此我也需要处理这个问题。 CPU为ARM处理器。我研究了从标准顶部获取负载的不同方法，perf
javascript - Jquery 麻烦!!负载 ("");
这个问题在这里已经有了答案: XMLHttpRequest Origin null is not allowed Access-Control-Allow-Origin for file:/// t
java - 如何找到远程系统的 CPU 负载
您好，我正在用 Java 开发负载平衡算法。在我的系统中将有一个主节点和 n 个从节点。主节点将接收查询分发给它的从节点。但是在将查询分发到其从节点之一之前，我想测量从节点中的当前负载，以检查特定从节
java - 渲染期间的高 CPU 负载
我正在渲染由大约 50 万个三角形组成的相当重的对象。我使用 opengl 显示列表，在渲染方法中只调用 glCallList。我认为一旦图形基元被编译成显示列表，cpu 的工作就完成了，它只是告诉
java - 找不到编码音频的 RTP 负载
我正在尝试加密 Sipdroid，为此我必须在 RTP 数据包获得编码的音频负载后对其进行加密。我在 RTP 数据包类中使用这个函数: public byte[] getPayload() {
Javascript:帮助解析奇怪的 JSON 负载
我正在尝试解析以下 JSON 负载: { "results":[ [ 298.648132, 280.68692, 356.54
android - 动画期间的高 CPU 负载
在动画期间 cpu 负载非常高(高达 75%) 是否有优化代码以降低 CPU 负载的方法？我的代码: ImageView myImageView = (ImageView)findViewById(

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

java - 如何提高 Neo4j 2.0 cypher/ExecutionResult 在重负载下的性能？