gpt4 book ai didi

xml - 从 XSLT 2 中的元素值中的语义层次结构创建父子元素

转载 作者:数据小太阳 更新时间:2023-10-29 02:35:40 25 4
gpt4 key购买 nike

我在 XML 内容中有一系列 P 标签,它们的起始值具有语义层次结构,但是,P 标签是线性的。寻找 XSLT 2 转换。

语义层次如下:

(1)
+-(a)
+-(I)
+-(A)

用正则表达式序列如下:

<xsl:param name="patternOrder" as="element(pattern)*" xmlns="">
<pattern level="1" value="^(\([0-9]+(\.[0-9]+)?\))" />
<pattern level="2" value="^(\([a-z]\))" />
<pattern level="3" value="^(\((IX|IV|V?I{{0,3}})\))" />
<pattern level="4" value="^(\([\w]+(\.[\w]+)?\))" />
</xsl>

查看我的数据集后,我有各种条件:

<?xml version="1.0" encoding="UTF-8"?>
<test>
<content>
<p>(1) blah</p>
<p>(2)(a) blah</p>
<p>(b) blah</p>
<p>(3)(a)(I) blah</p>
<p>(II) blah</p>
<p>(A) blah</p>
<p>(B.1) blah</p>
<p>(b) blah</p>
<p>(4) blah</p>
<p>(4.5) blah</p>
<p>(5)(a)(I)(A) blah</p>
<p>(B) blah</p>
<p>(II) blah</p>
<p>(III)(a) blah</p>
<p>(bb.2) blah</p>
<p>(6) blah</p>
</content>
<content>
<p>blah</p>
</content>
<content>
<p>blah</p>
<p>(1) blah</p>
<p>(a) blah</p>
<p>(b) blah</p>
<p>(2) blah </p>
</content>
</test>

...最终结果应该是:

<?xml version="1.0" encoding="UTF-8"?>
<test>
<content>
<p>(1) blah</p>
<p>(2)
<p>(a) blah</p>
<p>(b) blah</p>
</p>
<p>(3)
<p>(a)
<p>(I) blah</p>
<p>(II) blah
<p>(A) blah</p>
<p>(B) blah</p>
</p>
</p>
<p>(b) blah</p>
</p>
<p>(4) blah</p>
<p>(4.5) blah</p>
<p>(5)
<p>(a)
<p>(I)
<p>(A) blah</p>
<p>(B.1) blah</p>
</p>
<p>(II) blah</p>
<p>(III)</p>
<p>(a) blah</p>
<p>(bb.2) blah</p>
</p>
</p>
<p>(6) blah</p>
</content>
<content>
blah
</content>
<content>
blah
<p>(1) blah
<p>(a) blah</p>
<p>(b) blah</p>
</p>
<p>(2) blah </p>
</content>
</test>

请注意条件,如果 P 标签中不存在语义层次结构 - 那么 P 标签将被删除并且是其父内容元素的值。

编辑:

我已经能够使用以下 RegEx 检测所有语义条件:

^(\(([\w]+(\.[\w]+)?)\)){1,4}

*编辑 #2 *

具有调平属性:

<?xml version="1.0" encoding="UTF-8"?>
<test>
<content>
<p level="1">(1) blah</p>
<p level="1">(2)</p>
<p level="2">(a) blah</p>
<p level="2">(b) blah</p>
<p level="1">(3)</p>
<p level="2">(a)</p>
<p level="3">(I) blah</p>
<p level="3">(II) blah</p>
<p level="4">(A) blah</p>
<p level="4">(B.1) blah</p>
<p level="2">(b) blah</p>
<p level="1">(4) blah</p>
<p level="1">(4.5) blah</p>
<p level="1">(5)</p>
<p level="2">(a)</p>
<p level="3">(I)</p>
<p level="4">(A) blah</p>
<p level="4">(B) blah</p>
<p level="3">(II) blah</p>
<p level="3">(III)</p>
<p level="2">(a) blah</p>
<p level="2">(bb.2) blah</p>
<p level="2">(6) blah</p>
</content>
<content>
<p>blah</p>
</content>
<content>
<p>blah</p>
<p level="1">(1) blah</p>
<p level="2">(a) blah</p>
<p level="2">(b) blah</p>
<p level="1">(2) blah </p>
</content>
</test>

最佳答案

第一阶段:转型

<p>(2)(a) blah</p>
<p>(b) blah</p>

进入

<p>(2)</p>
<p>(a) blah</p>
<p>(b) blah</p>

使用类似的东西

<xsl:template match="p">
<xsl:for-each select="tokenize(., '\(')">
<xsl:if test="normalize-space(.)">
<p>(<xsl:value-of select="."/></p>
</xsl:if>
</xsl:for-each>
</xsl:template>

第二阶段:

先写一个函数

<xsl:function name="f:level" as="xs:integer">
<xsl:param name="p" as="element(p)"/>
....
</xsl:function>

它根据匹配您的正则表达式来计算“语义级别”。你似乎知道如何做这部分。

然后写一个递归分组函数:

<xsl:function name="f:group" as="element(p )*">
<xsl:param name="in" as="element(p )*"/>
<xsl:param name="level" as="xs:integer"/>
<xsl:for-each-group select="$in" group-starting-with="p[f:level(.)=$level]">
<p><xsl:value-of select="current-group()[1]"/>
<xsl:sequence select="f:group(current-group()[position() gt 1], $level+1)"/>
</p>
</xsl:for-each-group>
</xsl:function>

然后像这样调用这个函数:

<xsl:template match="content">
<xsl:sequence select="f:group(p, 1)"/>
</xsl:template>

未测试。

关于xml - 从 XSLT 2 中的元素值中的语义层次结构创建父子元素,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19884129/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com