gpt4 book ai didi

XmlSlurper - 列出 xhtml 文档的文本和常规节点

转载 作者:数据小太阳 更新时间:2023-10-29 02:28:24 27 4
gpt4 key购买 nike

我正在使用 Groovy 的 XmlSlurper 来解析 xhtml 文档(或 sudo xhthml 一个),我正在尝试获取文档的文本节点,但无法弄清楚如何,这是代码:

import groovy.util.*

xmlText = '''
<TEXTFORMAT INDENT="10" LEADING="-5">
<P ALIGN="LEFT">
<FONT FACE="Garamond Premr Pro" SIZE="20" COLOR="#001200" LETTERSPACING="0" KERNING="0">
Less is more! this
<FONT COLOR="#FFFF00">should be all</FONT>
the
<FONT COLOR="#00FF00"> words OR should some </FONT>
OTHER WORDS will be there?
</FONT>
</P>
</TEXTFORMAT>
'''
records = new XmlSlurper().parseText(xmlText)
records.P.FONT.children().eachWithIndex {it, index -> println "${index} - ${it}"}

打印以下输出:

0 - should be all 
1 - words OR should some

但我希望它也打印文本节点内容,因此所需的输出是:

0 - Less is more! this
1 - should be all
2 - the
3 - words OR should some
4 - OTHER WORDS will be there?

有什么想法吗?

最佳答案

看起来 XmlSlurper 没有单独的方法来检索“混合内容”

这里有个open item 添加方法支持Mixed Content -> Groovy JIRA

关于XmlSlurper - 列出 xhtml 文档的文本和常规节点,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/927545/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com