- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我刚刚进入图形数据库,我似乎一直遇到问题,决定是使用“ inode ”还是“索引属性”来跟踪诸如“节点类型”之类的内容。由于到目前为止我还没有真正的经验,我没有任何信息可以作为决定的依据,而且这两种方法似乎同样有效。
所以,问题是:两种方法之间的权衡是什么,规模(即节点数量)如何影响决策?
对于示例场景,假设有两种类型的“事物”:User
和 Product
,而 User 节点和 Product 节点之间的边并不那么重要,但我们关心的是我们是否想要 type: User
和 type: Product
每个节点上的属性,或者如果我们希望每个节点都有一条边指向 User
节点和 Product
节点,分别。
在什么情况下哪种方法更好?
注意:我特别关注 Neo4j 和 Titan,但我认为这也将更普遍地适用。
最佳答案
首先,你需要问自己:顶点/节点的类型是否需要被索引?即您是否需要按类型检索顶点/节点,比方说,从图中检索所有“用户”顶点,还是需要回答从检索给定类型的所有顶点开始然后进一步过滤/处理这些顶点的查询?
如果这个问题的答案是是 ,那么我建议您将该类型存储为已编入索引的字符串属性。或者,如果您使用基于 jvm 的语言进行开发,您可以定义一个类型枚举并将其用作属性类型,以实现更多类型安全和自动错误检查。 Titan 支持任意用户定义的类/枚举作为属性类型,并将压缩它们以减少内存占用。
但是,这种方法的缺点是无法扩展,因为您正在构建低选择性索引。这意味着可能会有很多“用户”或“产品”类型的顶点,所有这些都需要分别与“用户”或“产品”的索引条目相关联。这使得维护和查询此索引非常昂贵且难以扩展(想象一下 Facebook 有一个“类型”索引:“照片”条目下将有数十亿个顶点)。如果您(还)不关心缩放,那么这可以工作。
如果问题的答案是否 ,然后我建议将类型建模为图中的顶点/节点。即有一个“用户”顶点和一个“产品”顶点以及从每个用户到“用户”顶点标记为“类型”的边,等等。
这种方法的优点是您可以使用图形对数据进行建模,而不是让数据库外的字符串值代表关键类型信息。在您构建应用程序时,图形数据库将成为其核心组件并持续很长时间。随着编程语言和开发人员的来来去去,您不希望数据建模和类型信息随之而来并面临这样的问题:“SPECIAL_USER 是什么意思?”相反,有一个 SPECIAL_USER 顶点并向其添加出处信息,即谁创建了这种类型,它代表什么以及一个简短的描述——所有这些都在数据库中。
这种方法的一个问题是,随着应用程序的扩展,“用户”和“产品”顶点会有很多边缘事件。换句话说,您正在创建会产生扩展问题的 super 节点。这就是 Titan 引入单向边概念的原因。单向边就像网络上的链接:起始顶点指向另一个顶点,但该顶点不知道该边。由于您不想从“用户”顶点遍历到所有用户顶点,因此您不会失去任何东西,而是获得了可扩展性和性能。
关于database-design - 为什么在图形数据库中 inode 或索引属性会更好?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12754619/
这几天我一直在努力。我一直在自学 CSS,所以对菜鸟好一点。我正在创建一个推荐 slider 。推荐以 3 个 block 显示。我希望前 2 个下降,第 3 个上升。但是当 slider 激活时,无
我最近开始学习 Nodejs,现在我很困惑我的网络应用程序使用什么,html 还是 ejs (Express)。 Ejs 使用 Express 模块,而 .html 使用 HTML 模块。我的第一个问
假设我们有一个 PostgreSQL 表contacts,每条记录都有一堆带标签的电子邮件地址(标签和电子邮件对)——其中一个是“主要”。 存储方式如下: id 主键 电子邮件 文本 email_la
我成功为一种新的tesseract语言编写了traineddata文件,但是当我完成时,我继续收到以下错误: index >= 0 && index = 0 && 索引 < size_used_ :E
这个问题已经有答案了: How to deal with SettingWithCopyWarning in Pandas (21 个回答) 已关闭 4 年前。 假设我有一个像这样的数据框,第一列“密
如果我有一个位置或行/列同时用于 A 和 B 位置,请检查 B 是否与 A 成对角线? 1 2 3 4 5 6 7 8 9 例如,我如何检查 5 是否与 7 成对角线? 此外,如果我检查 4 是
MongoDB:索引 一、 创建索引 默认情况下,集合中的_id字段就是索引,我们可以通过getIndexes()方法来查看一个集合中的索引 > db.user.getIndexes() [ { "v
一、索引介绍 索引是一种用来快速查询数据的数据结构。 B+Tree就是一种常用的数据库索引数据结构,MongoDB采用B+Tree 做索引,索引创建在colletions上。 MongoDB不使用索引
我无法决定索引。 就像我有下面的查询需要太多时间来执行: select count(rn.NODE_ID) as Count, rnl.[ISO_COUNTRY_CODE] as Cou
我有这些表: CREATE TABLE `cstat` ( `id_cstat` bigint(20) NOT NULL, `lang_code` varchar(3) NOT NULL,
我正在尝试找到一种方法来提高包含 IP 范围的 mysql 表的性能(在高峰时段每秒最多有 500 个 SELECT 查询(!),所以我有点担心)。 我有一个这种结构的表: id smallint(
jquery index() 似乎无法识别元素之一,总是说“无法读取未定义的属性‘长度’”这是我的代码。mnumber 是导致问题的原因。我需要 number 和 mnumber 才能跟踪使用鼠标,并
我们有一个包含近 4000 万条记录的 MongoDB 集合。该集合的当前大小为 5GB。此集合中存储的数据包含以下字段: _id: "MongoDB id" userid: "user id" (i
文档说:如果你有多个字段的复合索引,你可以用它来查询字段的开始子集。所以如果你有一个索引一个,乙,丙你可以用它查询一种一个,乙a,b,c 我的问题是,如果我有一个像这样的复合索引一个,乙,丙我可以查询
我正在使用 $('#list option').each(function(){ //do stuff }); 循环列表中的选项。我想知道如何获取当前循环的索引? 因为我不想让 var i = 0;循
MySQL索引的建立对于MySQL的高效运行是很重要的,索引可以大大提高MySQL的检索速度。 打个比方,如果合理的设计且使用索引的MySQL是一辆兰博基尼的话,那么没有设计和使用索引的MySQL
SQLite 索引(Index) 索引(Index)是一种特殊的查找表,数据库搜索引擎用来加快数据检索。简单地说,索引是一个指向表中数据的指针。一个数据库中的索引与一本书后边的索引是非常相似的。
我是 RavenDB 的新手。我正在尝试使用多 map 索引功能,但我不确定这是否是解决我的问题的最佳方法。所以我有三个文件:Unit、Car、People。 汽车文件看起来像这样: { Id: "
我有以下数据,我想根据范围在另一个表中建立索引 我想要实现的是,例如,如果三星的销售额为 2500,则折扣为 2%,低于 3000 且高于 1000 我知道它可以通过索引来完成,与多个数组匹配,然后指
我正在检查并删除 SQL 数据库中的重复和冗余索引。 所以如果我有两个相同的索引,我会删除。 例如,如果我删除了重叠的索引... 索引1:品牌、型号 指标二:品牌、型号、价格 我删除索引 1。 相同顺
我是一名优秀的程序员,十分优秀!