xquery - 为什么我的 Optic API 查询的结果不是我在排序和过滤时所期望的？-6ren

xquery - 为什么我的 Optic API 查询的结果不是我在排序和过滤时所期望的？

转载作者：行者123 更新时间：2023-12-04 03:56:24

27

4

我想要完成的事情:
我目前正在开发一个 xquery 脚本，以 html 表的形式检索 marklogic 数据库的数据，并可以对每一列进行排序和过滤。
数据作为具有外键的不同文档分布在多个目录中，就像关系数据库保存数据一样。
现在这可能不是最佳解决方案，但遗憾的是我现在无法改变它。
有什么问题:
第一个解决方案是通过主目录 (smlaws) 上的 cts:search，它带有对所有元素进行过滤和排序的选项，并且效果很好。但是这些文档中不存在某些信息，因此我不得不进行多个其他查询以检索所有必要的数据，然后进行排序和过滤。
这适用于一些记录，但不适用于 40.000。
好吧，我现在正在尝试使用 TDE 和 marklogic 的光学 API 找到解决方案。
起初这看起来很棒，但是一旦我开始过滤和排序，我就没有得到预期的结果。
结果太随机了，我不明白这是怎么回事。
直接在文档插入后找到所有记录。几分钟后，他们不再是了。
如果我按列排序，我仍然会得到所有预期的结果。如果我然后按该列再次订购，但降序，我得到零结果。
这种行为似乎随机改变。
我检查了 marklogic 是否完成了索引。
我为每个过滤/排序的列创建了一个元素范围索引。

    {
      "localname": "identifier",
      "scalar-type": "string",
      "namespace-uri": "",
      "collation": "http://marklogic.com/collation/en/S1",
      "range-value-positions": false,
      "invalid-values": "ignore"
    }

此外，我想找到一种更好的方法来执行类似条件。
该脚本主要是动态的，这意味着对于当前的解决方案，我必须检查自己是否可以使用用户输入(过滤器)。
使用 cts:element-word-query 过滤效果更好，但结果未过滤，这可能是缺少索引的问题，但我不确定是否必须有其他索引。
简化的 xquery 脚本:

xquery version "1.0-ml";
import module namespace op = "http://marklogic.com/optic" at "/MarkLogic/optic.xqy";

let $smlawsview := op:from-view("main", "smlaws")
let $sfpublicationchannelsview := op:from-view("main", "sfpublicationchannels")
let $sfstatusview := op:from-view("main", "sfstatus")
let $smlawareasview := op:from-view("main", "smlawareas")

let $maps := $smlawsview
let $maps := op:where($maps, op:sql-condition(fn:concat("smlaws.identifier LIKE '%identifier%'")))
let $maps := op:join-inner($maps, $sfpublicationchannelsview, op:on("fksfpublicationchannels", op:view-col("sfpublicationchannels", "pksfpublicationchannels")))
let $maps := op:where($maps, op:eq(op:view-col("sfpublicationchannels", "fksfstatus"), "1"))
let $maps := op:join-inner($maps, $sfstatusview, op:on(op:view-col("sfpublicationchannels", "fksfstatus"), op:view-col("sfstatus", "pksfstatus")))
let $maps := op:join-inner($maps, $smlawareasview, op:on(op:view-col("smlaws", "fksmlawareas"), op:view-col("smlawareas", "pksmlawareas")))

let $maps := op:select($maps, (
    op:view-col("smlaws", "pksmlaws"),
    op:view-col("smlaws", "fksfpublicationchannels"),
    op:view-col("smlaws", "fksmlawareas"),
    op:view-col("smlaws", "identifier"),
    op:view-col("sfpublicationchannels", "fksfstatus"),
    op:view-col("sfstatus", "pksfstatus"),
    op:view-col("sfstatus", "identifier"),
    op:view-col("smlawareas", "pksmlawareas"),
    op:view-col("smlawareas", "identifier")
))

let $maps := op:order-by($maps, op:asc(op:view-col("smlaws", "identifier")))

let $maps := op:offset-limit($maps, op:param("offset"), op:param("limit"))

let $maps := op:result($maps, (),
        map:entry("offset", 0)
        => map:with("limit", 10)
)

return for $map in $maps
return element row {
    element id {map:get($map, "main.smlaws.pksmlaws")},
    element fksfpublicationchannels {map:get($map, "main.smlaws.fksfpublicationchannels")},
    element identifier {map:get($map, "main.smlaws.identifier")},
    element status {map:get($map, "main.sfstatus.pksfstatus")},
    element fksfstatus {map:get($map, "main.sfstatus.identifier")},
    element lawarea {map:get($map, "main.smlawareas.pksmlawareas")},
    element fksmlawareas {map:get($map, "main.smlawareas.identifier")}
}

示例文件:

<smlaws>
    <id>1</id>
    <identifier>law 1</identifier>
    <fksfpublicationchannels>1</fksfpublicationchannels>
    <fksmlawareas>1</fksmlawareas>
</smlaws>
<sfpublicationchannels>
    <id>1</id>
    <identifier>publicationchannel 1</identifier>
    <fksfstatus>1</fksfstatus>
</sfpublicationchannels>
<sfstatus>
    <id>1</id>
    <identifier>status 1</identifier>
</sfstatus>
<smlawareas>
    <id>1</id>
    <identifier>lawarea 1</identifier>
</smlawareas>

smlaws 示例:

<tde:template xmlns:tde='http://marklogic.com/xdmp/tde' xmlns:xsi='http://www.w3.org/2001/XMLSchema-instance' xsi:schemaLocation='http://marklogic.com/xdmp/tde '>
  <tde:description>TDE view for smlaws</tde:description>
  <tde:context>/envelope/instance/smlaws</tde:context>
  <tde:enabled>true</tde:enabled>
  <tde:rows>
    <tde:row>
      <tde:schema-name>main</tde:schema-name>
      <tde:view-name>smlaws</tde:view-name>
      <tde:columns>
        <tde:column>
          <tde:name>pksmlaws</tde:name>
          <tde:scalar-type>int</tde:scalar-type>
          <tde:val>id</tde:val>
          <tde:nullable>false</tde:nullable>
          <tde:collation>http://marklogic.com/collation/en/S1</tde:collation>
        </tde:column>
        <tde:column>
          <tde:name>fksmlawareas</tde:name>
          <tde:scalar-type>int</tde:scalar-type>
          <tde:val>fksmlawareas</tde:val>
          <tde:nullable>true</tde:nullable>
          <tde:collation>http://marklogic.com/collation/en/S1</tde:collation>
        </tde:column>
        <tde:column>
          <tde:name>identifier</tde:name>
          <tde:scalar-type>string</tde:scalar-type>
          <tde:val>identifier</tde:val>
          <tde:nullable>true</tde:nullable>
          <tde:collation>http://marklogic.com/collation/en/S1</tde:collation>
        </tde:column>
        <tde:column>
          <tde:name>fksfpublicationchannels</tde:name>
          <tde:scalar-type>int</tde:scalar-type>
          <tde:val>fksfpublicationchannels</tde:val>
          <tde:nullable>false</tde:nullable>
          <tde:collation>http://marklogic.com/collation/en/S1</tde:collation>
        </tde:column>
      </tde:columns>
    </tde:row>
  </tde:rows>
</tde:template>

问题:

我怎样才能找出我的设置有什么问题(无论是索引还是 tde 的
或 xquery，...) 我没有得到正确的结果？

对于我要完成的工作，是否有更好的解决方案？

有没有更好的方法来执行类似条件？

最佳答案

对于结果集的可变性，最好的步骤可能是提出支持票以开始调查。
对于用户提供的过滤条件，请考虑

op:where(op:sql-condition(...criteria...))

如此处所述: https://docs.marklogic.com/op:sql-condition
如果过滤条件可以在某些连接之前应用，
通过以下操作序列，查询可能会执行得更好:

根据需要加入过滤器

应用过滤器

按过滤行排序

对有序行的限制

完成其余的连接

订购最终输出

通过加入较小的数据集，可以减少工作量。如果用于过滤的列可以非规范化到 smlaws View 的源文档中，那么过滤可以在任何联接之前发生，这将最大限度地减少联接的数量。
希望有所帮助，

关于xquery - 为什么我的 Optic API 查询的结果不是我在排序和过滤时所期望的？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/63806831/

27

4

0

文章推荐： android - avc : denied { connectto } when using uds on Android 10

文章推荐： python-3.x - Python3过滤/删除列表的字符串

xquery - 如何运行简单的 xquery？我可以在浏览器本身中运行 XQuery 吗？
我是 XQuery 初学者。我需要任何软件来运行 XQuery 吗？我在哪里输入 XQuery 代码 - 在 HTML 页面或 XML 中？我应该使用什么扩展名来保存我的 XQuery 文件？最佳答
xquery - 我如何编写一个 XQuery 来测试正在使用的 XQuery 版本？
我正在编写一个 XQuery，它需要检查正在运行的 XQuery 版本(eXist、Saxon 等)。是否有一个标准函数可以返回 XQuery 的系统属性，例如版本、供应商等？我知道有一些系统特定的
xquery - xQuery 中的元素构造函数是什么？
我正在阅读 book about xQuery它充满了像元素构造函数这样的表达......我的问题是: 什么是元素构造函数，“{}”是元素构造函数吗？最佳答案元素构造函数创建一个元素。在 XQue
xquery - XQuery 实际是如何使用的？
我在网站上阅读了大量的 XQuery 教程。几乎他们所有人都在教我 XQuery 语法。假设我已经了解了 XQuery 语法，那么我将如何在我的网站上实际实现 XQuery？例如，我有book.xm
xquery - XQuery 中导入和声明模块命名空间的区别？
以下有什么区别: import module namespace fs = "http://expath.org/ns/file"; declare namespace an = "http://zo
xquery - XQuery 中的变量范围？
我有note.xml: Tove Jani Reminder Don't forget me this weekend! 和note.xqy: let $srcDoc:="not
xquery - XQuery 表达式求值的示例不是顺序的
我正在寻找一个示例，它表明 XQuery 表达式评估不是顺序的。在将 XQuery 的功能特性与过程语言进行比较时，总是会提到这一点。例如在 XQuery, 2nd edition ，在下面的部分:
xquery - 是否有可能使用 XQuery 生成随机数？
很难说出这里问的是什么。这个问题是模棱两可的、模糊的、不完整的、过于宽泛的或修辞的，无法以目前的形式得到合理的回答。如需帮助澄清这个问题以便重新打开它，visit the help center .
xquery - 如何从 XQuery 返回第一个结果
所以我有一个看起来像这样的 XQuery: for $i in /*:rootElement where $i/*:field = "test" return $i 这个查询返回了很多结果，但我真的只
xquery - 如何使用 xquery 替换属性的值
我有一个xml文档如下 sony vijay 我正在尝试写一个 xquery 1) 找到具有给定用户 ID 的用户 - sony 2) 将给定用户的“test”属性值更改为
xquery - 使用 XQuery 更新自动递增？
是否XQuery更新支持自增属性，就像SQL中的自增字段一样? 我正在使用 BaseX作为我的数据库。最佳答案给定 an answer from Christian Grün on the Bas
xquery - 使用 XQUERY 检索属性值
是否可以使用 XQUERY 来检索属性 filename从以下 XML？我正在尝试使用 /preFileDoc/inpXML/@filename但它不起作用...... ABC XYZ
xquery - 如何基于集合获取计数并使用 XQuery 进行多元素词查询？
尝试根据不同的过滤器计算一个集合中的汽车数量。即使我们看到多辆汽车满足要求，查询也返回计数 0。 fn:count(cts:search(fn:collection("com.cars"), cts:
xquery - 在 XQuery 中更新计数器
我想在 xquery 中创建一个计数器。我最初的尝试如下所示: let $count := 0 for $prod in $collection let $count := $count + 1 re
xquery - 使用 XQuery 获取序列中重复次数最多的元素
我有一系列的值。他们都可以是平等的……或者不是。所以使用 XQuery 我想获得序列中最频繁的项目。 let $counter := 0, $index1 := 0 for $value in $se
xquery - XQuery 中的运算符 "=>"有什么作用？
当我查找 XQuery 示例时，有时会看到使用了运算符 =>。我试图寻找它的含义，但找不到任何东西。由于我使用的是 MarkLogic，因此它可能仅适用于 MarkLogic，但我对此表示怀疑。从
xquery - 使用 XQuery 将日期输入转换为特定格式的字符串值
我必须使用 xquery 以 DDMMYYYY 格式创建日期字符串。输入到我的 xquery 的日期将类似于“2004-05-02T00:00:00+01:00”。截至目前，我正在使用以下解决方案来获
xquery - 使用 XQuery 求和
我正在使用 XQuery 执行加法。以下是数据库中保存的XML结构: 1 1001 50,1
xquery - 如何通过 Xquery 映射调整我的组？
忙于将 SQLServer 2008 R2 和 MarkLogic 8 与简单的个人实体进行比较。我的数据集适用于 100 万条记录/文档。注意:两个数据库都在同一台机器上(本地主机)。以下 SQL
xquery - Marklogic xquery 和有效循环子元素
想象一下，如果我有一个以下格式存储在 Marklogic 中的 xml 文档: DocumentID question1

首页

博学

6Ren·AI

商城

xquery - 为什么我的 Optic API 查询的结果不是我在排序和过滤时所期望的？