- r - 以节省内存的方式增长 data.frame
- ruby-on-rails - ruby/ruby on rails 内存泄漏检测
- android - 无法解析导入android.support.v7.app
- UNIX 域套接字与共享内存(映射文件)
我需要用 golang 解析一个 tei XML 文件。我尝试使用 encoding/xml unmarshaller。这是示例: http://play.golang.org/p/h0k-4IjngY
问题:
<TEI>
(所以 xml 不再有效),该示例打印了一些内容。<l>
内容的字符串?元素?n
的值属性,我该如何实现?解码是解析此类文件的正确方法还是 nokogiri 是更好的解决方案?
谢谢
最佳答案
使用 xml.Unmarshal() 读取此 XML 完全没问题.
问题是 XML 结构如下:
<TEI>
<text>
<sp>
</sp>
<sp>
</sp>
</text>
</TEI>
你的 Go 结构如下:
Page
[]Speak
少了一层。你的Page
可能匹配 <TEI>
或 <text>
元素,但不是两者。如果您删除 <TEI>
它对您有用元素因为那时Page
可以匹配 <text>
及其内容。
解决方案:
像这样添加另一个包装器:
type Text struct {
Txt Page `xml:"text"`
}
当然还有解析这种类型的值:
var p Text
err := xml.Unmarshal([]byte(data), &p)
在 Go Playground 上尝试修改后的代码.
关于xml - 使用 golang 解析 tei XML,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28811899/
我正在尝试使用 spaCy 来标记文本文档,其中命名实体包含在 XML 标记中。例如。 TEI -喜欢Harry goes to Hogwarts . import spacy nlp = spacy
根据 TEI P5 指南,我已经用 xml 编码了一本书,我正试图在 html 页面中将其可视化。真正的目的是可视化编码文本及其所有格式标签 TEI P5 指南(文本格式、内部引用等)。所以,最大的问
我正在尝试将 tex 文件转换为 xml。 我特别想知道是否可以生成一个 TEI xml 文件 (http://www.tei-c.org/index.xml) 从 tex 文件在线发布。 是否有关于
我需要用 golang 解析一个 tei XML 文件。我尝试使用 encoding/xml unmarshaller。这是示例: http://play.golang.org/p/h0k-4Ijng
我有一个 TEI 编码的 xml 文件,其实体如下: Sampson. Gregory: A my word wee'l n
CSS 代码: .face_dropcap_ { font-size: 3em; font-family: Palatino,serif; font-weight: norma
我正在尝试使用 R 包 CEM 执行粗化的精确匹配。我有一个观察数据框(没有遗漏的观察结果,列名见下文),我正在尝试: 以抑郁症 (depres6mo) 进行 CEM 作为匹配治疗,然后 对匹配的数据
我在互联网上(也在这个论坛上)找到了很多解决这个问题的方法,但我仍然可以解决我的问题。 我有这个代码:
我正在尝试使用 Beautiful Soup 从使用 Grobid 生成的 .tei.xml 文件中提取元素。 我可以使用以下方式获取标题: titles = soup.findAll('title'
我是一名优秀的程序员,十分优秀!