Jackrabbit 跨连接节点搜索-6ren

Jackrabbit 跨连接节点搜索

转载作者：行者123 更新时间：2023-12-04 16:00:33

28

4

我在 Jackrabbit 存储库中标记了对象(实际上是 Adobe/Day CQ 的 CRX，但我认为这是 Jackrabbit 代码):

Assets :标签 = A、B

子 Assets 数据 1:标签 = A、C、E

子 Assets 数据 2:标签 = D、E

我想查询父 Assets 的标签集和一个子 Assets 的联合，即“BC”将匹配 Assets ，因为我们在父 Assets 和子 Assets 1 中都有 Assets ，但“CD”不匹配，因为没有组合父节点和一个子节点匹配，因为 C 和 D 被拆分到不同的子数据节点。

有没有办法在 Jackrabbit 中做到这一点？我们可以编写一个 XPath 查询

\\element(*, dam:Asset)[(@tags = 'C' or *\@tags='C')
                        and (@tags = 'D' or *\@tags='D')]

但这不起作用，因为 XPath 似乎不能保证 *加入的子 Assets 是相同的，即这意味着“任何 child 都有 C/D”，因此将匹配我的 Assets ，因为 1+ 个 child 有一个 C，1+ 个 child 有一个 D。相反，我可以使用 JCR-SQL2

SELECT * FROM dam:Asset as asset
  LEFT OUTER JOIN nt:unstructured as child ON ISCHILDNODE(child,asset)
  WHERE (asset.tags = 'C' or child.tags = 'C')
    AND (asset.tags = 'D' or child.tags = 'D')

但没有 SELECT DISTINCT在 JCR-SQL2 中:如果相反，我搜索“B E”，我将得到此 Assets 返回两次，因为这与 Assets +child1 和 Assets +child2 匹配。

我可以对 Java 中的查询结果进行后处理，即过滤掉第一种情况的假阳性匹配或过滤掉第二种情况的重复结果，但我很担心这会如何影响分页性能:我需要扫描更多节点不需要清除坏节点，我需要扫描批次以计算正确的分页结果大小。对于第二个 SQL2 案例，这应该更便宜，因为如果我的搜索是有序的，我可以仅根据节点路径发现重复项，并且所有重复项都将是连续的，因此我可以通过廉价扫描找到给定页面的数据值(value)，但希望无需阅读每个结果的整个节点，但即使对于简单的仅路径情况，我也不知道为分页计数扫描所有结果的成本。

我们考虑的另一个选择是将标签非规范化为单个节点。在这种情况下，为了保持搜索准确，这意味着在每个子节点中创建一个新的 combine_tags 属性并仅对子节点集执行所有搜索。然而，如果我们匹配同一 Assets 下的两个子节点，这仍然会遇到明显的问题。

感谢您的任何建议。这已经是一个大型实例，需要进一步扩展。我看到其他问题说 ModeShape 是一个 JCR 实现，它确实有 SELECT DISTINCT但我认为为此切换到 ModeShape 将是最后的手段，如果确实可以在 ModeShape 上托管 CQ。

我们现在提出的一个想法是计算 Assets 标签和子标签的每个联合并将标签组合成一个字符串，然后将每个值写为 Assets 的多值属性，即 Assets + child1 = "ABCE"和 Assets + child2 = "ABDE"，所以我们得到

Assets :标签 = A、B； tagUnions = "A B C E", "A B D E"

只要我们定义将标签组合成字符串的固定顺序(例如字母顺序)，我们就可以使用 tagUnions LIKE '%B%C%' 搜索任何组合。 (除了在实际情况下我会在标签之间使用适当的分隔符)。虽然就我们所见，这将起作用，但我并不真正喜欢它:每个 Assets +子项可能有大量标签，所有标签的名称都比单个字母长，这意味着我们最终会执行长字符串 LIKE对所有可能无法有效索引的查询。

另一种做法是制作位掩码:定义 A=1、B=2 等，并在此处存储多值整数数组，然后执行按位比较。然而，这可能仅限于 64 个不同的标签，而且由于我们有 1,000 多个标签，我认为我们无法做到这一点——即使 JCR 支持按位运算，我预计它不会。

所以我仍在寻找一个干净的类似数据库的解决方案。你已经错过了我提供的赏金，但仍然有滴答声、选票和对任何帮助的感激之情。

最佳答案

来自 the Apache Jackrabbit mailing list :

Yes, unfortunately union queries are not supported. Any work on that area would be much appreciated.

Meanwhile the best workaround is probably to do two separate queries and to explicitly perform the union in the application code by combining the two result sets.

所以，这是一个选项。查看您提供的 SQL:

but there's no SELECT DISTINCT in JCR-SQL2: if instead I search for "B E" I will get this asset returned twice because this matches both asset+child1 and asset+child2.

我查看了 Jackrabbit 支持的可能解决方案，结果空手而归。但是，我同意提出的解决方案 here :

What I did is to do a simple SELECT with appropriated ORDER BYs... then each time I used a row, I veried that it isn't the same as the previous :-)

(切片保存。)

而 ORDER BY除非您需要数据库支持的排序，否则可能是可疑的，是否有什么阻止您在 Controller 中构建哈希集以将结果限制为仅使用 JCR API 的唯一值？

关于Jackrabbit 跨连接节点搜索，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/9871554/

28

4

0

文章推荐： linq - RavenDB - LINQ - Count() 差异

文章推荐： symfony - Symfony2 中的服务依赖注入(inject)

文章推荐： xcode - 有没有办法在 XCode 4 中同时编辑多行？

JavaFX - 每行迭代 GridPane 节点 - 每行读取 GridPane 节点
我正在使用 JavaFX 8 创建一个应用程序。我使用拖/放动态更改网格 Pane 的内容。我希望每行或每行/列迭代 GridPane 内容。JavaFX 允许通过指定行和列在 GridPane 中添
javascript - 错误:无法在“节点”上执行“appendChild”:参数1不是“节点”类型
我正在尝试将图像拖放到div上。图像没有被拖到div上并给出以下错误 Uncaught TypeError: Failed to execute 'appendChild' on 'Node': pa
java - 如何在 ARcore 的帮助下相对于一个 anchor 定位 anchor /节点/ anchor 节点？
我正在 android studio 中创建内部构建 AR 导航。我正在寻找一种方法将 anchor 与其他 anchor 或 anchor 节点/节点“连接”起来。我不确定使用哪一个。基于我将强制用
hadoop - 我的 2 节点 hadoop 比我的 4 节点 hadoop 表现更好
我在 Hive 上运行一些作业:首先是 4 节点，然后是 2 节点。令我惊讶的是，我的 2 节点性能比我的 4 节点更好。首先，我在一个 4 节点(4 个事件节点)上运行查询，然后关闭 2 个节点(
c++ - ' =' : cannot convert from ' CircularDoubleDirectedList::节点 *' to ' 节点 *'
我有 Node* current ，我在其中存储指向列表“顶部”当前节点的指针。当我将一个新节点设置为当前节点时，出现错误: '=' : cannot convert from 'CircularDo
linux - 无法使用 dcos 节点 ssh --master-proxy --leader sshing 进入 dcos 节点
我是 dcos Mesos 的新手，在本地 Ubuntu 机器上安装了 dc os。我可以查看 dcos 仪表板。但我无法使用 dcos node ssh --master-proxy --lea
JavaFX:如何定位组件/节点？
在 JavaFX 中，是否有类似 setLayout(); 的东西？或 setBounds(); ? 例如，我想将按钮定位到我想要的位置。最佳答案 JavaFX 场景图上的所有内容都是 Node .
JavaFX 节点 - 如何让最终用户调整它们的大小？
我正在开发一个 JavaFX 应用程序，其中我开发的类(从 javafx.scene.Parent 扩展)是根据用户在 ListView 控件中单击的条目动态创建的。只是要清楚这个节点，它不是使用像
uml - 节点-边缘关系的类图
我正在尝试为节点-边缘关系创建一个类图，因为它可以在有向图中找到。我想传达的是，Nodes 引用了 Edges，Edges 也引用了 Nodes。每个 Edge 都恰好需要两个 Node(源和目标)。
hadoop - 如何指定应在其上运行mapreduce的各个tasktrackers(节点)？
在mapreduce作业期间，单个任务将在随机节点上运行，是否有任何方法限制应在其中运行任务的节点？最佳答案 Hadoop不会选择节点来随机运行任务。考虑到数据局部性，否则将有很多网络开销。任务与
Cassandra 节点 - 重建与重建维修
有什么区别: a) nodetool 重建 b) nodetool 修复 [-pr] 换句话来说，各个命令到底是做什么的？最佳答案 nodetool重建:类似于引导过程(当您向集群添加新节点时)，但
java - 节点 : 没有数据类型
我已将第一个 OneToMany 关系添加到我的 hibernate 3.6.10 项目中。这是一个类: /** * */ package com.heavyweightsoftware.leal
javascript - 获取触发事件的元素(节点)
是否有可能找到正在监听触发当前函数的事件的元素？在下面的代码中，event.target 返回 #xScrollPane 和 event.currentTarget 和 event 的最低子节点.f
javascript - 覆盖数据而不生成新的键/节点
我正在尝试覆盖我数据库中的一些数据。结构很简单，就是: recipes { user_1{ recipe_1{data} recipe_2{data} } user_2{
javascript - 输入后运行JS函数，节点
我使用 setInterval 来运行该函数，但它会多次执行函数 2... 如何在输入中插入一个值后执行函数第一个输入与其余输入的距离不同如何在插入 val(tab 选项)后将插入从 1 个输入移
c++ - “节点”不是全局命名空间的成员？
我不知道代码有什么问题，但在 visual studio 中不断收到这些错误消息。 Error 18 error C1903: unable to recover from previous e
JavaScript/jQuery 节点
我正在尝试从其类中获取 SharePoint 搜索导航节点的对象。 var nodes = $("div.ms-qSuggest-listItem"); 我正在获取节点对象，现在想要获取“_promp
javascript - 节点|运行JS文件时出错
D:\nodeP>node main.js module.js:327 抛出错误； ^ 错误:在 Function.Module 的 Function.Module._resolveFilename
c++ - 节点(){}是什么意思？
struct node{ int key, prior, cnt, val; node *l, *r; node(){} node(int nkey) : key(nkey),
c++ - 如何删除正在使用的对象(节点)
我有以下代码使用迭代器将项目插入双链表。这就是我们被要求这样做的方式。代码有效，但问题是我有 24 字节的绝对内存泄漏。 NodeIterator insert(NodeIterator & itrP

首页

博学

6Ren·AI

商城

Jackrabbit 跨连接节点搜索