gpt4 book ai didi

xml - 使用XSLT从具有嵌入式链接的XML中提取纯文本

转载 作者:行者123 更新时间:2023-12-03 16:07:04 24 4
gpt4 key购买 nike

我正在尝试从XML中提取类似于以下内容的文本:

<p>This is a paragraph <a href='http://link.com'>with an embedded link</a> with more text afterwards</p>

我希望提取的文本在段落中保持URL,如下所示:

This is a paragraph with an embedded link (http://link.com) with more text afterwards

提取文本相当简单:

<xsl:value-of select="p"/>和URL:<xsl:value-of select="p/a/@href"/>,但是我正在努力思考一种使用XSLT在提取的文本中嵌入URL的方法。

关于如何做到这一点的任何想法?

如果没有简便的方法,我可能会对文本进行一些预处理以嵌入URL,然后仅使用XSLT从那里提取所有文本。

最佳答案

<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output method="text" indent="yes"/>

<xsl:template match="/">
<xsl:apply-templates/>
</xsl:template>

<xsl:template match="text()">
<xsl:value-of select="."/>
</xsl:template>

<xsl:template match="a">
<xsl:value-of select="."/>

<xsl:value-of select="concat(' (', @href, ')')"/>
</xsl:template>

</xsl:stylesheet>


模板 <xsl:template match="text()">匹配文本节点并仅输出它们。

模板 <xsl:template match="a">输出 a元素的内容及其 (@href)值。

关于xml - 使用XSLT从具有嵌入式链接的XML中提取纯文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7990244/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com