java - 在 XSLT 中对记录进行分组时如何避免 O(n^2) 的复杂性？-6ren

java - 在 XSLT 中对记录进行分组时如何避免 O(n^2) 的复杂性？

转载作者：搜寻专家更新时间：2023-10-31 08:24:00

27

4

当我使用 XSL 将大量数据转换为 HTML 时，我经常遇到性能问题。这些数据通常只是几个大致为这种形式的非常大的表:

<table>
  <record>
    <group>1</group>
    <data>abc</abc>
  </record>
  <record>
    <group>1</group>
    <data>def</abc>
  </record>
  <record>
    <group>2</group>
    <data>ghi</abc>
  </record>
</table>

在转换过程中，我想像这样直观地对记录进行分组

+--------------+
| Group 1      |
+--------------+
|   abc        |
|   def        |
+--------------+
| Group 2      |
+--------------+
|   ghi        |
+--------------+

一个愚蠢的实现是这个(设置来自 http://exslt.org 。实际实现有点不同，这只是一个例子):

<xsl:for-each select="set:distinct(/table/record/group)">
  <xsl:variable name="group" select="."/>

  <!-- This access needs to be made faster : -->
  <xsl:for-each select="/table/record[group = $group]">
    <!-- Do the table stuff -->
  </xsl:for-each>
</xsl:for-each>

很容易看出这往往有 O(n^2)复杂。更糟糕的是，每条记录中都有很多字段。操作的数据可以达到几十MB，记录数可以达到5000条。最坏的情况下，每条记录都有自己的组和50个字段。更糟糕的是，还有另一个级别的分组，这使得 O(n^3)

现在会有很多选择:

我可以找到一个涉及映射和嵌套数据结构的 Java 解决方案。但我想提高我的 XSLT 技能，所以这实际上是最后的选择。
我可能忘记了 Xerces/Xalan/Exslt 中的一个很好的功能，它可以更好地处理分组
我也许可以为 /table/record/group 建立某种索引
你可以向我证明 <xsl:apply-templates/>在此用例中，方法明显比 <xsl:for-each/> 更快方法。

你怎么看这个O(n^2)可以降低复杂性吗？

最佳答案

您可以只使用 XSLT 1.0 中众所周知的 Muenchian 分组方法——无需探索已排序的数据和实现更复杂和更慢的算法:

<xsl:stylesheet version="1.0"
 xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
 <xsl:output omit-xml-declaration="yes" indent="yes"/>
 <xsl:strip-space elements="*"/>

 <xsl:key name="kGroupByVal" match="group" use="."/>

 <xsl:template match="node()|@*">
     <xsl:copy>
       <xsl:apply-templates select="node()|@*"/>
     </xsl:copy>
 </xsl:template>

 <xsl:template match=
  "group
      [generate-id()
      =
       generate-id(key('kGroupByVal', .)[1])
      ]">
  <group gid="{.}">
   <xsl:apply-templates select="key('kGroupByVal', .)/node()"/>
  </group>
 </xsl:template>
 <xsl:template match="group/text()"/>
</xsl:stylesheet>

当此转换应用于您提供的文本(这甚至不是格式正确的 XML 文档!!!)在将其更正为格式正确后，

3 个record 元素需要 80 毫秒。

对于具有 1000 个 record 元素的相似文本，转换在 136 毫秒内完成。

对于 10000 个 record 元素，所用时间为 284 毫秒。

有 100000 个 record 元素，所用时间为 1667 毫秒。

观察到的复杂性显然是次线性的。

很难(如果可能的话)找到比 XSLT 1.0 中的 Muenchian 分组更有效的解决方案。

关于java - 在 XSLT 中对记录进行分组时如何避免 O(n^2) 的复杂性？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/8077106/

27

4

0

文章推荐： jquery - DatePicker 不适用于 bootstrap 4

文章推荐： javascript - 使用 Jquery 和 HTML 按日期排序

xslt - 使用 XSLT 从 XSLT 样式表中删除命名空间声明
我有一个 XSLT 样式表，如下所示: 我想使用第二个 XSLT 样式表来转换此样式表，以删除与 XQHead
xslt - 一个大的 xslt 优于更小、更细粒度的 xslt
我们有一个大型 xslt，可以呈现整个商店区域，包括产品、制造商，并根据价格和类别进行过滤。我使用 sitecore 作为 CMS，但遇到缓存问题。我有大约 9000 个项目，有些页面需要长达 20
xslt - XSLT:是否应用带有条件参数的模板？
我想根据条件的结果应用具有不同参数的模板。像这样： Attribute no. 1
xslt - 循环 XSLT
我有一些看起来像这样的 XML Foo Details Bar Details Baz Details Foo Blah Bar BlahBlah Baz BlahBlahBl
xslt - XSLT 中的矩阵转置
我试图从这种输入出发: a b c d e f g ... 使用 XSLT 的 HTML 输出: one two a e b f
xslt - xslt 中的第一个子节点名称
我想知道如何在 xslt 中找到特定节点的第一个子节点名称。我有一个 xml: some text 我可以使用 body/
xslt - XSLT 中上个月的最后一天
是否可以在 XSLT 中获取上个月的最后一天？我找到了这个函数:http://www.xsltfunctions.com/xsl/functx_last-day-of-month.html但我不确定如
xslt - xslt 中匹配命名空间的问题
具有特定节点的匹配元素存在问题。 xml: description of profile PhoneKeyPad S
xslt - XSLT 中的动态变量
我将一堆键值对作为参数传递给 XSL(日期 ->“1 月 20 日”，作者 ->“Dominic Rodger”，...)。我正在解析的一些 XML 中引用了这些 - XML 如下所示: 目前，除
xslt - xslt 中最后一个字符后的子字符串
我找不到这个问题的确切答案，所以我希望有人能在这里帮助我。我有一个字符串，我想在最后一个 '.' 之后获取子字符串。我正在使用 xslt 1.0。这是怎么做的？这是我的代码。
xslt - XSLT 中的变量范围
我在尝试找出 xslt 上的 var 范围时遇到问题。我实际上想要做的是忽略具有重复“旅游代码”的“旅行”标签。示例 XML: X1 Budapest X1 Budapest X
xslt - XSLT 中的动态排序？
我有一些数据在 xslt 的 for-each 循环中输出。我对列表进行了分页，但没有对排序选择器进行分页。用户应该能够对 2 个值(创建的数据和每个项目的数字字段)进行排序。默认的排序方法是创建日
xslt - XSLT 的奇怪排序要求
我有一个奇怪的要求。我在 xslt 中有一个包含月份的变量，带有它们的 id (1-12) 问题是我需要全部显示它们，但从一月(1)以外的月份开始。目前我有以下 JAN
xslt - 模块化 xslt？
如何在 xslt 转换中模块化一组重复的输出？例如，我有如下内容(伪代码)。并
xslt - XSLT 中的位置字符串拆分
我得到一个像这样的字符串。 13091711111100222222003333330044444400 字符串的模式是这样的 13 - 09 - 17 - 11111 - 100 - 22222 -
xslt - XSLT 中的设计和编码模式
我是 XSLT 的新手，有一个一般性问题。为了区分具有不同属性的两个元素，最好(也是为了性能)使用和而不是在一个模板中。据我所知，这就是 XSLT 中应该“思考”的方式。但在我看来，这有一个缺点
xslt - 如何从字符串中删除连字符 +xslt
如何从“19650512-0065”到“196505120065”这样的字符串中删除连字符使用这个模板:传递 theID =
xslt - XSLT 中的填充零
是否有任何功能可以在左侧填充零？我正在尝试做的要求是: 我们不知道即将到来的输入字符串长度。如果小于 20，我们必须在左侧填充零。如果输入字符串长度为 10，那么我们必须在左侧填充 10 个零。
xslt - XSLT 应用模板的默认选择是什么？
身份模板如下所示: 是否选择多于，或者身份模板可能是这样的？当我执行以下操作时，究竟选择了什么？最佳答案
xslt - XSLT 模板中的超链接
我正在尝试使用 XML 信息和 XSLT 模板创建超链接。这是 XML 源代码。 Among individual stocks, the top percentage gainers in the

首页

博学

6Ren·AI

商城

java - 在 XSLT 中对记录进行分组时如何避免 O(n^2) 的复杂性？