neo4j - Titan 如何使用 HBase/Cassandra 实现恒定时间查找？-6ren

neo4j - Titan 如何使用 HBase/Cassandra 实现恒定时间查找？

转载作者：行者123 更新时间：2023-12-04 16:52:41

25

4

在 O'Reilly 的书“Graph Databases”的第 6 章中，关于 Neo4j 如何存储图形数据库，它说:

To understand why native graph processing is so much more efficient than graphs based on heavy indexing, consider the following. Depending on the implementation, index lookups could be O(log n) in algorithmic complexity versus O(1) for looking up immediate relationships. To traverse a network of m steps, the cost of the indexed approach, at O(m log n), dwarfs the cost of O(m) for an implementation that uses index-free adjacency.

然后解释 Neo4j 通过将所有节点和关系存储为固定大小的记录来实现这种恒定时间查找:

With fixed sized records and pointer-like record IDs, traversals are implemented simply by chasing pointers around a data structure, which can be performed at very high speed. To traverse a particular relationship from one node to another, the database performs several cheap ID computations (these computations are much cheaper than searching global indexes, as we’d have to do if faking a graph in a non-graph native database)

这最后一句话引发了我的问题:使用 Cassandra 或 HBase 作为存储后端的 Titan 如何实现这些性能提升或弥补它？

最佳答案

Neo4j 仅在数据位于同一 JVM 中的内存中时才达到 O(1)。当数据在磁盘上时，由于在磁盘上追逐指针(它们的磁盘表示很差)，Neo4j 很慢。

当数据位于同一 JVM 的内存中时，Titan 仅实现 O(1)。当数据在磁盘上时，Titan 比 Neo4j 更快，因为它具有更好的磁盘表示。

请参阅以下博客文章，从数量上解释了上述内容:
http://thinkaurelius.com/2013/11/24/boutique-graph-data-with-titan/

因此，当人们说 O(1) 时，了解他们在内存层次结构的哪个部分很重要。当您在单个 JVM(单机)中时，很容易变得快速，正如 Neo4j 和 Titan 各自的缓存所展示的那样引擎。当你不能把整个图形放在内存中时，你就不得不依赖智能磁盘布局、分布式缓存等。

请参阅以下两篇博文了解更多信息:

http://thinkaurelius.com/2013/11/01/a-letter-regarding-native-graph-databases/
http://thinkaurelius.com/2013/07/22/scalable-graph-computing-der-gekrummte-graph/

关于neo4j - Titan 如何使用 HBase/Cassandra 实现恒定时间查找？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/26009102/

25

4

0

文章推荐： Haskell:如何测试未编译的代码？

文章推荐： meteor - Iron Router 上的上一页位置

文章推荐： sql - 上个季度和下个季度

文章推荐： r - 通过取消列出然后重新列出将矢量化函数应用于列表

titan - tinkerpop/titan 中使用什么机制来确定顶点的绝对顺序？
执行以下遍历时: graph.addVertex("a") graph.addVertex("b") graph.addVertex("c") graph.traversal().V().range(
titan - 如何排除 gremlin titan 中的某些顶点
例如，我想在查询时排除一些顶点 ID。第 1 步:我正在带领用户跟随我 (1234): g.V(1234).outE("following") 输出: 9876,3246,2343,3452,123
titan - 在 Titan/Janus 中启用力索引时索引失败
我写了一个 JUnit 测试来检查 generate-modern.groovy如果 marko 存在，则绘制图表。我的小鬼查询是 "g.V().has('name','marko')"; 正如您在
titan - 计算 Titan 上的 super 节点
在我的系统中，我要求节点上的边数必须存储为顶点上的内部属性以及特定输出边上的以顶点为中心的索引。这自然需要我在所有数据加载完成后计算节点上的边数。我这样做如下: long edgeCount = gr
titan - 如何使用 Gremlin/Titan/TinkerPop3 更新特定的边属性？
目标我有一个足够简单的任务需要完成:设置特定边属性的权重。以这个场景为例: 我想做的是更新 weight 的值. 附加要求如果边不存在，则应创建它。两个节点之间最多只能存在一条相同类型的边(即，
titan - 无法删除/删除Vertex Titan 1.0 Tinkerpop 3上的多个属性键
一个非常基本的问题我刚刚将Titan从0.54升级到Titan 1.0 Hadoop 1/TP3版本3.01。我在删除的值时遇到问题 Property key: Cardinality.LIST/
elasticsearch - titan- elasticseach和com.thinkaurelius.titan.diskstorage.es.ElasticSearchIndex
我是泰坦的新手。我正在使用ubuntu 12.04并使用从deb软件包安装的cassandra 2.0和ES 1.0。我试图让ES与titan一起工作。 gremlin> g = TitanF
titan - titan 1.0.0 中的 gremlin 并未在 Windows 上开箱即用
我正在关注 http://s3.thinkaurelius.com/docs/titan/1.0.0/getting-started.html我的 Windows 机器上的指南。但我在第一步就陷入困
titan - 使用 TinkerPop 3 Restful 接口(interface)连接到 Titan Graphdb
我对 Titan/Gremlin/TinkerPop3 非常陌生，正在尝试使用 Restful API 接口(interface)来创建/修改/删除数据库中的顶点/边。我主要想看看是否可以使用tin
graph - 将Rexster(titan 0.4)查询迁移到Gremlin Server(Titan 1.0)查询
我正在使用以下Rexster查询: string gremlinQuery = "g.v(" + companyVertexId + ").transform{[salaryInfo:it.outE
titan - 将 Titan-1.0.0 迁移到 janusgraph-0.1.1
我正在使用 Titan-1.0.0，我想将其迁移到 janusgraph-0.1.1。我需要做哪些配置更改？我还想使用 JanusGraph 重用 Titan 的数据。最佳答案从 Titan 迁移
titan - 如何去除两个顶点之间的边？
我想删除两个顶点之间的边，所以我在 java tinkerpop3 中的代码如下 private void removeEdgeOfTwoVertices(Vertex fromV, Vertex t
titan - 如何在两个当前连接的顶点之间插入一个顶点？
我正在尝试掌握 Gremlin。彻底阅读文档后，我似乎仍然在概念上苦苦挣扎。我正在创建一个基本的新闻源，遵循此处 Neo4j 文档中的模型: http://neo4j.com/docs/snapsh
Titan:添加新顶点或边后刷新图形
我在 Spring Web 应用程序中使用 Titan。当我添加新边或删除一个顶点时，它实际上已删除但未反射(reflect)在我的网页中。我的查询仍然得到旧的边或顶点。为此，我必须重新启动我的应用
titan - 图遍历中的gremlin查询if-else-then
我一直试图在 Gremlin 查询中找出这个 if-else。假设 g.V({0}) 是下面的群顶点。 var q = "g.V({0}).as('groupName', 'groupId',
Titan Db 忽略索引
我有一个带有几个索引的图表。它们是两个带有标签限制的复合指数。 (两者在不同的属性/标签上完全相同)。一个似乎确实有效，但另一个无效。我已经完成了以下 profile() 以进行双重检查: 一个叫K
titan - Gremlin - 如何在不明确列出属性的情况下合并顶点以组合它们的属性？
背景:我正在尝试使用 this approach 实现一个时间序列版本数据库，使用 gremlin (tinkerpop v3)。我想获取给定身份节点(蓝色)的最新状态节点(红色)(由包含时间戳范围
titan - Gremlin:找到两个顶点之间的边的有效方法是什么？
很明显，在两个顶点之间找到边的简单方法是: graph.traversal().V(outVertex).bothE(edgeLabel).filter(__.otherV().is(inVertex
titan - 在TinkerPop中next()意味着什么
我目前正在阅读TinkerPop3 Documentation 我感到困惑的是，我找不到关于next()的任何解释。例如，w/next()或w/o next()返回相同的文字 gremlin> g.
titan - 使用TitanDB是否为 "safe"？
在DataStax收购Aurelius之后，自从Titan 1.0.0在2015年9月发布以来，自那时以来几乎没有提交过，所以我想知道在生产中使用TitanDB是否安全。谁能给我一些见识？最佳答案

首页

博学

6Ren·AI

商城

neo4j - Titan 如何使用 HBase/Cassandra 实现恒定时间查找？