- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我了解 golang xml ,innerxml
标签允许以原始 xml 形式获取元素内部内容。但我需要的是获取整个元素(开放标签、内部内容、关闭标签)作为原始数据。
这是一个我想以这种方式解析的示例。我想要完整的<Useful>
包含所有可能的属性元素并避免获得无用的元素。
package main
import (
"encoding/xml"
"fmt"
)
const data = `<Document>
<Useless1>
blah-blah
</Useless1>
<Useless2>
blah-blah
</Useless2>
<Useful someAttr="someVal">
<InnerField1>Inner field 1 value</InnerField1>
<InnerField2>Inner field 2 value</InnerField2>
<InnerField3>Inner field 3 value</InnerField3>
</Useful>
<Useless3>
blah-blah
</Useless3>
</Document>
`
func main() {
doc := Document{}
err := xml.Unmarshal([]byte(data), &doc)
if err != nil {
panic(err)
}
fmt.Println(doc.Useful.Data)
}
type Document struct {
XMLName xml.Name `xml:"Document"`
Useful struct {
Data string `xml:",innerxml"`
} `xml:"Useful"`
}
Playground 中代码的链接在这里: https://goplay.space/#0KDXiRKDwlY
这就是我得到的:
<InnerField1>Inner field 1 value</InnerField1>
<InnerField2>Inner field 2 value</InnerField2>
<InnerField3>Inner field 3 value</InnerField3>
这就是我想要得到的:
<Useful someAttr="someVal">
<InnerField1>Inner field 1 value</InnerField1>
<InnerField2>Inner field 2 value</InnerField2>
<InnerField3>Inner field 3 value</InnerField3>
</Useful>
请注意,我正在使用的实际结构要复杂得多。我不想得到整个 <Document>
将内部内容作为原始 xml 进行解析,然后尝试手动删除无用的元素。 <Useful>
部分有所不同,所以我无法硬编码,例如属性导致它们在不同文档之间可能有所不同。
最佳答案
您可以在 Useful
中使用附加字段struct 来捕获所有属性(类型为 xml.Attr
的 slice ),如下所示:
Useful struct {
Attrs []xml.Attr `xml:",any,attr"`
Data string `xml:",innerxml"`
} `xml:"Useful"`
向 <Useful>
添加另一个属性时:
<Useful someAttr="someVal" someAttr2="someVal2">
...
<Useful>
并输出结果 fmt.Printf("%+v", doc.Useful)
,输出将是(在 Go Playground 上尝试):
{Attrs:[{Name:{Space: Local:someAttr} Value:someVal} {Name:{Space: Local:someAttr2} Value:someVal2}] Data:
<InnerField1>Inner field 1 value</InnerField1>
<InnerField2>Inner field 2 value</InnerField2>
<InnerField3>Inner field 3 value</InnerField3>
}
另一种更复杂的方法是使用 xml.Decoder
通过token读取输入,并标记<Useful>
的开始和结束位置。然后你就可以获得<Useful>
的完整原始XML .
它可能是这样的:
dec := xml.NewDecoder(strings.NewReader(data))
var start, end int64
foundStart := false
for {
if !foundStart {
start = dec.InputOffset()
}
t, err := dec.Token()
if err != nil {
if err != io.EOF {
fmt.Println(err)
}
break
}
if se, ok := t.(xml.StartElement); ok {
if se.Name.Local == "Useful" {
foundStart = true
}
}
if se, ok := t.(xml.EndElement); ok {
if se.Name.Local == "Useful" {
end = dec.InputOffset()
// We may break here, we got what we wanted
break
}
}
}
fmt.Println(data[start:end])
它输出(在 Go Playground 上尝试):
<Useful someAttr="someVal" someAttr2="someVal2">
<InnerField1>Inner field 1 value</InnerField1>
<InnerField2>Inner field 2 value</InnerField2>
<InnerField3>Inner field 3 value</InnerField3>
</Useful>
由于我们不处理<Useful>
的内容,我们可以使用 Decoder.Skip()
来加快速度像这样:
dec := xml.NewDecoder(strings.NewReader(data))
var start, end int64
for {
start = dec.InputOffset()
t, err := dec.Token()
if err != nil {
if err != io.EOF {
fmt.Println(err)
}
break
}
if se, ok := t.(xml.StartElement); ok {
if se.Name.Local != "Useful" {
continue
}
if err := dec.Skip(); err != nil {
fmt.Println(err)
break
}
end = dec.InputOffset()
break
}
}
fmt.Println(data[start:end])
输出是一样的。试试这个 Go Playground .
关于xml - 获取原始元素表示,包括开始和结束标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58765192/
127.0.0.1:8000/api/仅包含来自第二个应用程序的 url,但我将两个 url 模块链接到相同的模式。甚至有可能做到这一点吗? 第一个应用程序: from django.urls imp
我目前正在学习 ColdFusion。我有 PHP 背景,对此我有点困惑。 我有一个选择菜单,我希望将选项保存在不同的文件中。 (例如 options.cfm)当我调用文件时,我想在选择菜单中包含选项
字符串: "75,000", "is", "95%", "or", "95/100" "of", "monthly", "income" o/p: "is","%, "or", "/", "of",
我有 4 个 javascript 文件(每个文件对应一个 HTML 文件),所有 4 个文件中的 3 个函数都是相同的。我想找到一个顺利的解决方案,我可以以某种方式分别包含这 3 个函数...是否可
我在 PHP 中有这种情况,其中 include在一台服务器上被遗漏,但在另一台服务器上没有(我没有设置服务器,所以我不能告诉你更多;我不是真正的 devops 人,所以这就是我在这里问的原因)。两台
这是一个模式文件,midi.xsd定义类型,note ,用于存储 MIDI 音符值: 这是另一个模式文件,octaves.xsd使用
我想备份以下文件夹 /home /etc /usr/local /root /var /boot 并排除 /var/tmp /var/run /var/lock /home/*/.thumbnails
如何重新编码具有许多值(包括缺失值)的数值变量,以获得数字 0:n-1哪里n是唯一值的数量,包括 NA ,整齐? 例子: df 1 1000 0 2 1000 0 3 N
选择元素的 html(包括在内)的最佳方法是什么?例如: This is just a test. 而$('#testDiv').html()返回"This is just a test."
我正在尝试设置Varnish来处理本地环境中的ESI包含。 我在虚拟机中运行 Varnish ,内容在主机上运行。 我有两个文件“index.html”和“test.html”。它们都存储在apach
我有以下内容,并且想要检索“ FromEmail”不为空的数据 Simple email@gma
欧海,我正在编写一个小型 PHP 应用程序,使用一个单独的 config.php 文件和一个functions.php,其中包含我将在应用程序中使用的所有自定义函数。现在,我真的必须在每个函数中包含
我知道可以将 JavaScript 放在一个特定的 .js 文件中,然后通过执行以下操作将其包含在任何页面中...... 我注意到,对于包含的这些 .js 文件: 它们实际上不必以 .js 结尾 其
我使用 gwt UIBinder 添加了一些项目到我的 ComboBox。 --select one-- Dispute Referral Form Dispute Settlement Clause
我可以将一个 first.c 文件包含到另一个 second.c 中吗? (我正在做一些套接字编程,以将服务器收到的消息存储在链接列表中,因此在第一个程序中,我尝试保留链接列表和第二个程序套接字编程文
我有一个简单的 Spring MVC 数据项目设置,我试图选择 Admin 中尚不存在的用户列表。 table 。这是我的存储库方法 SELECT u FROM User u WHERE u.id N
在 bash 脚本中,使用什么实用程序以及如何删除两个字符串之间的文本,包括字符串。 原文: (ABC blah1)blah 2(def blah 5)blah 7)(DEF blah 8)blah
我有这个 BST 问题,我试图用 Java 解决,但我不知道为什么它不起作用。问题是: 二叉搜索树 (BST) 是一种二叉树,其中每个值节点大于或等于该节点的所有节点中的值左子树并且小于该树中所有节点
我有一个字符串,其中包含“Dollars”和“Cents”符号。我想删除它们。我试过了 string.replaceAll("[\"\\u00A2\" $]", "") 但它不起作用。正确的做法是什么
我在 stories 和 tags 之间有一个多对多的关系,为保存关系而创建的表是 taxonomies。我想搜索所有具有所有给定标签的故事。 到目前为止我使用的查询是这个,当然它对我不起作用,它返回
我是一名优秀的程序员,十分优秀!