marklogic - 元素词位置 - 概念性问题-6ren

marklogic - 元素词位置 - 概念性问题

转载作者：行者123 更新时间：2023-12-04 16:11:25

30

4

我正在尝试了解 element word positions 索引设置的影响。请参阅以下 xquery，它返回简单 element-word-query 搜索的计划:

xdmp:plan(cts:search(doc(), 
  cts:and-query(
    cts:element-word-query(xs:QName("name"), "element word position")
  ),
  ("unfiltered")
))

如果未激活索引，则final-plan(简化形式以节省空间):

<qry:and-query>
    <qry:term-query>element(name),pair(word("element"),word("word"))</qry:term-query>
    <qry:term-query>element(name),pair(word("word"),word("position"))</qry:term-query>
    <qry:term-query>word("element")</qry:term-query>
    <qry:term-query>word("word")</qry:term-query>
    <qry:term-query>word("position")</qry:term-query>
</qry:and-query>

索引启动后的查询计划(word-positions以及element word positions):

<qry:and-query>
    <qry:term-query>element(name),pair(word("element"),word("word"))</qry:term-query>
    <qry:term-query>element(name),pair(word("word"),word("position"))</qry:term-query>
    <qry:element-query>
        element(name)
        <qry:word-query>
            <qry:KP pos="0">word("element")</qry:KP>
            <qry:KP pos="1">word("word")</qry:KP>
            <qry:KP pos="2">word("position")</qry:KP>
        </qry:word-query>
    </qry:element-query>
</qry:and-query>

所以我假设，因为生成的 term-query 少得多，因此生成的候选片段 ID 计数将更小，因此索引解析的交集更快。除此之外，我真的很想了解 element-query 的幕后工作原理。所以我有几个问题:

如果element word positions被激活，索引中会保存什么样的附加信息？
索引和发帖列表会是什么样子？键只是元素还是元素+单词的组合？有没有可视化它的图形资源？ (没想到你会画点什么)
另外，element-query 是如何执行的？我看到一个简单的 term-query 如何返回术语键的发布列表，但我不确定 element-query 与 word-query 作为“子查询”进行评估。

编辑:添加了一张图片以可视化我对启用元素词位置时索引的外观的理解。 (有关详细信息，请参阅 mholstege 的答案评论) enter image description here

最佳答案

当您打开位置时，我们会在相关术语的索引中存储每个文档的位置向量，而不仅仅是文档 ID。

考虑这一点的方法是根据叶查询的特殊性以及计算它们和交叉中间结果所涉及的工作。

当您在查询计划中看到术语查询时，这意味着它只是在查找文档 ID，因此不知道相对定位——对于像这样的长短语来说，结果不太准确，因为“元素word”和“word position”可能出现在文档中两个不同的父元素中。如果您的数据在每个文档中只有一个具有此名称的元素，那是不可能发生的，尽管您仍然可能会出现错误匹配，其中两个单词的子短语以相反的顺序出现，或者被其他单词分隔。

当您在查询计划中看到单词查询时，这意味着我们将查看位置，在这里您会看到短语中每个单词的相对位置。当这个问题解决后，我们检查位置向量并剔除那些不意味着这个位置约束的向量。因此，所有匹配项都将按以下顺序包含此单词序列:更精确的匹配项。

计划中的元素查询还应用了元素实例相对于元素内匹配项的位置约束。存在优化，其中元素位置约束实际上被下推到查询树的叶子以避免过多的中间计算。

您还会看到一些技术上冗余的术语查询:这些查询的目的是进行简单的术语查找，这些查询可能比叶词查询更受限制。由于 and-query 的术语列表的交集总是从最短匹配的发布列表开始，这可以提供一种快速失败机制来避免更昂贵的位置计算。其中有一定数量的启发式判断，并且给定一组复杂的索引选项和查询变体，有时这些附加术语实际上没有帮助。

关于marklogic - 元素词位置 - 概念性问题，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/53948303/

30

4

0

文章推荐： Neo4J 远程客户端接受

文章推荐： django - 以编程方式向组添加权限的正确方法是什么

文章推荐： node-gyp - 基于构建配置的 GYP 变量

java - 如何使用 LatLng 获取起始位置/位置。我确实有一个正在移动的当前位置/位置
我正在尝试获取从过去的 startposition/location 到当前移动的 currentposition/location 的距离(以米为单位)。我确实有工作正常的currentposit
javascript - 保存和加载 div 位置 - 缩放并保存在加载时改变 div 位置
所以我有一堆绝对覆盖的 div。用户通过在叠加层上拖动来创建方形 div。如果您要创建一个 div，然后放大和缩小，div 会保持在同一位置，因为它对叠加层是绝对的，如前所述。然而问题就出在这里。您
android - 在android中的显示器(屏幕)上查找 View 位置(位置)
我想找到 View 在显示屏幕上的位置。为此，我使用了 view.getLeft() 、view.getBottom() 、view.getRight() 等方法> , view.getTop()。
ios - UIScrollView - 需要 x 位置/宽度的约束，需要 y 位置/高度的约束
我有一个看起来像这样的 View 层次结构(基于其他答案和 Apple 的使用 UIScrollView 的高级 AutoLayout 指南): ScrollView 所需的2 个步骤是: 为 Scr
MySQL如何对一名学生的科目成绩进行排名/位置
所以我有一个名为 MARKS 的表，我有这些列 STUDENT_ID, CLASSFORM_NAME, ACADEMIC_YEAR, TERM, SUBJECT_NAME, TOTAL_MARKS
jQuery 位置
我有一个问题我无法理解，请帮助: 我开发了带有图像的 html 页面，并使用 jQuery UI 帮助使它们可拖动，我将这些图像位置设置为相对位置并给出了左侧和顶部像素，这是页面的链接 http://
IE11中的CSS动画背景-位置
我正在尝试创建一个 CSS 动画，它在 sprite 表中循环播放 16 个图像，给人一种幽灵“漂浮”的错觉。动画通过在 background-position 位置之间移动以显示不同状态的幽灵来实现
Flutter WebView 位置
我正在创建这个网站的 WebView https://nearxt.com/打开时询问位置但是当我使用此链接在 flutter 中创建 webview 时那么它就无法定位我还在应用程序中定义了位置，但
swift - NSWindow 位置
我正在以编程方式创建一个需要跨越 2 个屏幕的窗口。正在创建的窗口的大小是正确的，但窗口大约从第一个屏幕的一半开始。我可以将它拖回第一个屏幕的开头，NSWindow 非常适合。我只需要知道在窗口的起
javascript - 位置 "/"的匹配叶路由没有元素
位置“/”的匹配叶路由没有元素。这意味着默认情况下它将呈现一个空值，从而导致一个“空”页面 //App.js File import { BrowserRouter as Router, Routes
ubuntu - 向网络公开目录/位置
我有一个运行 Ubuntu 和 Apache 的 VPS 例如，假设地址是:5.5.5.5 在 VPS 上，我有一个名为 eggdrop 的用户(除了我的 root 用户)。用户 eggdrop 有
JLabel ImageIcon 位置
我有一个 JLabel与 ImageIcon ，我使用 setIcon() JLabel中的函数. ImageIcon然后上来，坐在我的JLabel 的文字左侧.是否有可能拥有 ImageIcon在文
Graphviz:xlabel 位置
我的图中有节点，它们的 xlabels 位于它们的左上方。我怎样才能改变这个位置？我希望 xlabels 正好位于节点本身的旁边。最佳答案 xlp是你想要的属性，但它没有做任何事情。你不能改变位置
VIM 自定义函数定义/位置
我对基本的 VIM 功能有疑问:(我尝试谷歌搜索但找不到答案) 如何列出所有自定义功能。(我做了 :function 并且不能找到我的自定义函数) 如何获得自定义函数列表中的函数(或它们的存储位置)。
Php 位置 ("some other page")
我是 PHP 的新手，虽然我一直在搜索，但我不知道该怎么做。我知道可以使用 Location("some page") 进行重定向。我还读到，只要没有向用户显示任何内容，它就可以工作。我想做的是:
jquery jgrowl 位置
如果在 jgrowl.css 中位置更改为“center”，我如何将其覆盖为默认值，即“top-right” $.jGrowl(data, { header: 'data', an
iphone - UISwipeGestureRecognizer 位置
我需要根据用户是否滑动屏幕顶部、屏幕中间或屏幕底部来触发不同的事件。我正在尝试找出最好/最简单的方法来做到这一点，因为我很确定没有办法从 UISwipeGestureRecognizer 获取位置。
delphi - 如何获取由delphi生成的EXE的VMT表的地址(位置)
我需要枚举用delphi编写的外部应用程序中使用的类，因此我需要访问VMT表以获取该信息，但是我找不到任何有关如何在exe（由delphi生成）文件中找到VMT（虚拟方法表）的位置（地址）的文档。
delphi - 不区分大小写位置
在 D2010 (unicode) 中是否有像 Pos 这样不区分大小写的类似函数？我知道我可以使用 Pos(AnsiUpperCase(FindString), AnsiUpperCase(Sou
位置:固定在reveal.js中
我正在尝试为我的reveal.js 演示文稿制作一个标题，该标题会粘贴在屏幕顶部。标题中的内容在每张幻灯片的基础上都是动态的，因此我必须将标记放在 section 标记中。显然，如果标记在 sect

首页

博学

6Ren·AI

商城

marklogic - 元素词位置 - 概念性问题