performance - Neo4J 调优还是更多 RAM？-6ren

performance - Neo4J 调优还是更多 RAM？

转载作者：行者123 更新时间：2023-12-01 08:23:51

27

4

我有一个 Neo4J 企业数据库，运行在具有 8Gb RAM 和 80Gb SSD 的 DigitalOcean VPS 上。Neo4J 实例的性能目前很糟糕:

match (n) where n.gram='0gram' AND n.word=~'a.' return n.word LIMIT 5 @ 349ms 
match (n) where n.gram='0gram' AND n.word=~'a.*' return n.word LIMIT 25 @ 1588ms

我知道正则表达式很昂贵，但在我将 'a.' 或 'a.*' 部分替换为任何其他字母的类似查询中，Neo4j 只会崩溃.在此之前，我可以看到内存中的巨大积累(接近 90%)，并且 CPU 飙升。

我的 Neo4j 填充如下:

Number Of Relationship Type Ids In Use: 1,
Number Of Node Ids In Use: 172412046,
Number Of Relationship Ids In Use: 172219328,
Number Of Property Ids In Use: 344453742

VPS 仅运行 Neo4J(在 debian 7/amd64 上)。我使用 NUMA+parallelGcflags，因为它们应该更快。我一直在调整我的 RAM 设置，虽然它现在不经常崩溃，但我觉得应该有一些收获

neostore.nodestore.db.mapped_memory=1024M
neostore.relationshipstore.db.mapped_memory=2048M
neostore.propertystore.db.mapped_memory=6144M
neostore.propertystore.db.strings.mapped_memory=512M
neostore.propertystore.db.arrays.mapped_memory=512M

# caching
cache_type=hpc
node_cache_array_fraction=7
relationship_cache_array_fraction=5
# node_cache_size=3G
# relationship_cache_size=1G  --> these throw a not-enough-heap-mem error

数据本质上是一系列树，其中在node0上只需要进行全文搜索，后面的节点通过具有浮点值的属性进行搜索。

node0 -REL-> node0.1 -REL-> node0.1.1 ... node0.1.1.1.1
      \
       -REL-> node0.2 -REL-> node0.2.1 ... node0.2.1.1

大约有。 5.000 个顶级节点，例如 node0。

我应该重新配置我的内存/缓存使用情况，还是应该添加更多 RAM？

--- 编辑索引---

因为所有树的节点总是 4 层深，每个级别都有一个标签以便快速查找。在这种情况下，所有 node0 节点都有一个标签(称为 0gram ). n.gram='0gram' 应该使用与标签耦合的索引。

--- 编辑新配置---

我将 VPS 升级到 16Gb。 SSD 上的 nodeStore 有 2.3Gb (11%)，PropertyStore 有 13.8Gb (64%)，relationshipStore 有 5.6Gb (26%)。在此基础上我创建了一个新的配置(详见上文)。我正在等待全套查询，同时会做一些额外的测试

最佳答案

是的，你需要创建一个索引，你的标签叫什么？想象一下它被称为 :NGram

create index on :NGram(gram);

match (n:NGram) where n.gram='0gram' AND n.word=~'a.' return n.word LIMIT 5

match (n:NGram) where n.gram='0gram' AND n.word=~'a.*' return n.word LIMIT 25

您所做的不是图形搜索，而只是通过全扫描 + 与正则表达式进行属性比较的查找。不是一个非常有效的操作。您需要的是 FullTextSearch(新模式索引不支持它，但旧索引仍然支持它)。

你能运行这个查询(在你创建索引之后)并说出它返回了多少个节点吗？

match (n:NGram) where n.gram='0gram' return count(*)

相当于

match (n:NGram {gram:'0gram'}) return count(*)

我写了一个blog post about it几天前，请阅读它，看看它是否适用于您的情况。

磁盘上的 Neo4j 数据库有多大？配置的堆大小是多少？ (在 neo4j-wrapper.conf 中？)

如您所见，您使用的 RAM 比您机器的内存还多(甚至不包括操作系统或文件系统缓存)。

所以你必须减少 mmio 大小，例如节点为 500M，rels 为 2G，属性为 1G。

查看您的存储文件大小并相应地设置 mmio。

关于performance - Neo4J 调优还是更多 RAM？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/22958350/

27

4

0

文章推荐： java - Spring Boot 如何使用 jwt 管理用户角色

文章推荐： Azure SignalR 服务

文章推荐： scala - 部分应用带有第一个和第二个参数的 Function2

文章推荐： Azure 服务计划 - 横向扩展费用

ios - 如何使“更多”按钮始终进入“更多 View ”？
我正在开发一个带选项卡栏的 ios 应用程序。我的栏上有超过 5 个按钮，所以在 iphone 上我有更多的按钮。现在，假设我有这个按钮:Button1 Button2 Button3 Button4
ios - 修改 UITabBarController 的“更多”选项卡中显示的选项卡导航栏上的“更多”按钮
我有一个带有 UITabBarController 的应用，其中有超过五个选项卡。当我按更多选项卡时，我会转到moreNavigationController，它是一个UINavigationCon
ios - 当我单击“更多”按钮而不是我离开的 VC 时，如何返回 iOS 中“更多...”按钮的 "Table"
我有一个导航 Controller 。 NAVC->MORE... 按钮，然后在“更多”下有一些额外的 VC。如果我转到“更多...”下的 VC，然后转到不在“更多...”上的 VC，那么当我返回到
c# - (更多)线程二叉树中旋转节点时的高效锁定
因此，我想出了这种方案，用于在多个线程同时具有读写访问权限的二叉树中旋转时锁定节点，这涉及每次旋转锁定四个节点，这似乎是一个很多吗？我想到了一种比我想出的方法更聪明的方法来减少所需的锁定，但谷歌并没有
css - 无法将我的下拉菜单与下拉按钮对齐(更多)
所以我已经尝试了所有方法，但我似乎仍然无法将下拉内容与 dropbtn 对齐。我只希望内容始终位于更多菜单下方。 HTML: `
linux - 期待和——更多——
我正在尝试使用 expect 来自动接受在 --more-- 中提示的 EULA。 #!/usr/bin/expect spawn "./greenplum-perfmon-web-4.1.2.0-b
javascript - 更多/更少的影响
他们如何在下面提供的网站上制作“告诉我更多”效果。我读过 read more/less effect in jQuery，但我发现该站点的有趣之处在于，除非单击该按钮，否则无法滚动页面。 Effect
scala - 更多 Scala 打字问题
现在，Kim Stebel helped me understanding如何使用存在类型键入变量，我需要知道如何在继承中使用它们: 以下代码无法编译: class PagingListModel(s
cygwin - Cygwin不提供“更多”命令吗？
在我的Cygwin中不可用。另一方面，提供了“ less”命令。也许Cygwin的制造商认为“更多”只是多余的。我对此很好奇。最佳答案安装util-linux软件包，您将获得“更多”的信息 ht
Azure:更多 DTU 还是更多分片？
基本上，我想知道是否有人有增加 DTU 与分片的经验。 DTU应该线性地提高性能。因此，如果您有 5 个 DTU，而您改为 10 个 DTU，那么(理论上)您应该获得大约两倍的性能。因此，四个 SQ
javascript - 更多 DOM 元素造成性能问题
我们使用 asp.net mvc、javascript 和 jQuery(托管在本地计算机上)创建了一个应用程序。基本设计是，当用户从一个页面导航到其他页面时，我们通过隐藏和显示 HTML 页面，将所
haskell - 更多 rmonad 库？
我想用 RMonad 做一些基本的事情。有没有办法使用“as monad”功能来有一个身份 rmonad，可以应用 monad 转换器吗？有诸如 StateT 变压器之类的常见东西吗？向现有 m
c - 如何检查数组的元素是否被占用？ +1 更多
我有一个 char*[] 数组。我需要能够为其分配字符串并再次删除它们，但我不知道: 如何检查一个元素中是否已经有一个字符串，这样我就不会覆盖它，如果它已经被占用，则继续处理下一个元素？之后如何将其
Azure:更多 DTU 还是更多分片？
基本上，我想知道是否有人有增加 DTU 与分片的经验。 DTU应该线性地提高性能。因此，如果您有 5 个 DTU，而您改为 10 个 DTU，那么(理论上)您应该获得大约两倍的性能。因此，四个 SQ
unix - 如何仅在错误输出时使用寻呼机(更多/更少)
我有一个程序可以同时吐出标准错误和标准输出，我想在标准错误上少运行寻呼机，但忽略标准输出。我该怎么做？更新: 就是这样......我不想丢失标准输出......只是让它远离寻呼机 program 2
jquery - 如何让段落的其余部分在“更多...”链接上设置动画？
基本上，当单击具有类 "dropdown" 的链接时，我无法获取“更多...”链接来对下一个跨度的高度进行动画处理。它根本就没有动画。仅当更改为 Less... 链接并且单击 Less... 链接以折
javascript - 更多 Javascript 状态图框架
我正在使用 ExtJS，并认为它是一个了不起的框架。但是，它们没有内置的状态图，这使得依赖于状态的应用程序开发非常痛苦。我最近发现了这个: https://github.com/jakesgordo
c - 更多 C 指针问题
我一直在研究数据结构和算法，遗憾的是在C中。我已经单独实现了一个双向链表，它保存整数并且工作正常，但是当节点(或pub)让它正常工作时我遇到了很多麻烦在本例中)保存多个不同类型的值。我可以创建一个列表
c# 使用声明-更多 = 好还是坏？
编辑拼写错误你好，这可能是一个愚蠢的问题，但如果它能帮助我遵循最佳实践，我不在乎:P 假设我想在 System.Data 命名空间...以及 System.Data.SqlClient 命名空间中
javascript - 单击时更改按钮文本(更多/更少)
使用 bootstrap 3 CSS、font awesome CSS 和最新的 jQuery JS 文件。我正在使用 javascript 在单击按钮时在另一个内容 div 之上隐藏/显示一个内容

首页

博学

6Ren·AI

商城

performance - Neo4J 调优还是更多 RAM？