gpt4 book ai didi

xml - XSLT 函数返回不同的结果 [Saxon-EE vs Saxon-HE/PE]

转载 作者:数据小太阳 更新时间:2023-10-29 01:45:34 36 4
gpt4 key购买 nike

我目前正在使用各种版本的 Saxon-Processor 进行纯 XSL 转换。下面是我的简短样式表,根据我的问题的需要进行了简化:

<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet version="2.0"
xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
xmlns:xs="http://www.w3.org/2001/XMLSchema"
xmlns:foo="bar">

<xsl:output encoding="UTF-8" method="text"/>

<xsl:template match="/">
<xsl:text>Call of func_1: </xsl:text>
<xsl:value-of select="foo:func_1()"/>

<xsl:text>&#xA;Call of func_1: </xsl:text>
<xsl:value-of select="foo:func_1()"/>

<xsl:text>&#xA;Call of func_1: </xsl:text>
<xsl:value-of select="foo:func_1()"/>

<xsl:text>&#xA;Call of func_2: </xsl:text>
<xsl:value-of select="foo:func_2()"/>
</xsl:template>

<xsl:function name="foo:func_1" as="xs:string">
<!-- do some other stuff -->
<xsl:value-of select="foo:func_2()"/>
</xsl:function>

<xsl:function name="foo:func_2" as="xs:string">
<xsl:variable name="node">
<xsl:comment/>
</xsl:variable>
<xsl:sequence select="generate-id($node)"/>
</xsl:function>

</xsl:stylesheet>

描述

foo:func_1 是一个包装函数,用于返回第二个函数的值 + 做其他事情,可以忽略。这个函数调用其他函数的概念是强制性的!

foo:func_2 为元素生成一个唯一的 ID。此元素在名为“节点”的局部范围变量中创建。

基于撒克逊版本的不同结果

预期结果:

Call of func_1: d2
Call of func_1: d3
Call of func_1: d4
Call of func_2: d5

Saxon-EE 9.6.0.7/Saxon-EE 9.6.0.5 结果

Call of func_1: d2
Call of func_1: d2
Call of func_1: d2
Call of func_2: d3

Saxon-HE 9.6.0.5/Saxon-PE 9.6.0.5/Saxon-EE 9.5.1.6/Saxon-HE 9.5.1.6 结果

like expected

问题/进一步深入

我尽可能自己调试了这个问题。如果我将函数“func_1”中的 xsl:value-of 更改为 xsl:sequence,所有版本的结果都将相同 [如预期]。但这不是我的本意!

我想了解整个 Saxon 版本中 xsl:value-ofxsl:sequence 之间的区别是什么。是否有任何“隐藏”缓存?在我的例子中,使用 xsl:sequencexsl:value-of 的正确方法是什么。 [顺便说一句:我已经知道,value-of 使用 select-statement 的结果创建了一个文本节点。序列可以是对节点或原子值的引用。不要解决我的问题afaik]

最佳答案

这是一个由来已久、颇为深奥的问题。在纯函数式语言中,使用相同的参数调用纯函数两次总是产生相同的结果。这使得许多优化成为可能,例如,如果参数不变,则将函数调用从循环中拉出,或者如果函数调用不是递归的,则将其内联。不幸的是,XSLT 和 XQuery 函数并不是纯粹的函数:特别是,它们被定义为如果函数创建新节点,则两次调用该函数会产生不同的节点(f() is f()返回 false)。

Saxon 优化器非常努力地在这些约束内尽可能地进行优化,特别是通过识别创建新节点的函数并避免对此类函数进行激进的优化。

但规范本身并不是 100% 规定性的。例如,如果在您的示例中有一个不依赖于函数参数的局部变量,我认为规范为实现提供了关于变量值是每次评估时的相同节点还是新节点的许可.

正如 Martin 所说,新的 XSLT 3.0 属性 new-each-time 试图控制这种情况:如果每次调用函数时你真的想要一个新节点,你应该指定 new-each-时间="是"

注意:

这里发生的特定优化(您可以通过使用 -explain 选项运行看到)是 func_2 首先被内联,然后它的主体被提取到一个全局变量中。一些版本正在这样做,而另一些则没有——它可能对微小的变化非常敏感。最好的建议是不要依赖有这种副作用的函数。如果您解释了您的真正问题,这会有所帮助,那么也许我们可以找到一种对语言语义中的边缘情况不太敏感的方法。

关于xml - XSLT 函数返回不同的结果 [Saxon-EE vs Saxon-HE/PE],我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39387103/

36 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com