- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我需要用 Python 机器生成(而不是解析!)一个(可能很复杂)XML 文件。
我(相对)熟悉 xml 和 lxml 模块,但我不清楚如何根据 xsl 规范生成有效的 XML 检查。
我需要构建的是这样的:
<?xml version='1.0' encoding='utf-8'?>
<package xmlns="http://www.idpf.org/2007/opf" unique-identifier="uuid_id" version="2.0">
<metadata xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:opf="http://www.idpf.org/2007/opf">
<dc:identifier opf:scheme="calibre" id="calibre_id">4117</dc:identifier>
<dc:identifier opf:scheme="uuid" id="uuid_id">d06a2234-67b4-40db-8f4a-136e52057101</dc:identifier>
<dc:title>La Fine Di Alice</dc:title>
<dc:creator opf:file-as="Homes, A. M." opf:role="aut">A. M. Homes</dc:creator>
<dc:contributor opf:file-as="calibre" opf:role="bkp">calibre (3.10.0) [https://calibre-ebook.com]</dc:contributor>
<dc:date>2005-11-15T00:00:00+00:00</dc:date>
<dc:publisher>Minimum Fax</dc:publisher>
<dc:identifier opf:scheme="ISBN">9788875210649</dc:identifier>
<dc:language>en</dc:language>
<meta content="{"A. M. Homes": ""}" name="calibre:author_link_map"/>
<meta content="2017-11-07T07:34:41.217796+00:00" name="calibre:timestamp"/>
<meta content="La Fine Di Alice" name="calibre:title_sort"/>
</metadata>
<guide>
<reference href="cover.jpg" title="Cover" type="cover"/>
</guide>
</package>
完整语法为here .
我尝试了一些类似的东西:
from lxml import etree as ET
et = ET.Element('package', attrib={'version': "2.0", 'xmlns': "http://www.idpf.org/2007/opf", 'unique-identifier': "BookId"})
md = ET.SubElement(et, 'metadata', attrib={'xmlns:dc': "http://purl.org/dc/elements/1.1/", 'xmlns:opf': "http://www.idpf.org/2007/opf"})
au = ET.SubElement(md, 'dc:title')
au.text = bk['Title']
s = ET.tostring(et, pretty_print=True)
...但它惨遭失败:“ValueError: 无效的属性名称 'xmlns:dc'”
欢迎任何指点。
最佳答案
引用:http://lxml.de/tutorial.html#namespaces
您不得将命名空间指定为 :
限定字符串。相反,您可以使用 {http://url.url/url}tag
形式或 QName
形式。
这是您的程序,使用命名空间:
from lxml import etree as ET
NS_DC = "http://purl.org/dc/elements/1.1/"
NS_OPF = "http://www.idpf.org/2007/opf"
nsmap = {
"dc": NS_DC,
None: NS_OPF,
}
PACKAGE = ET.QName(NS_OPF, 'package')
METADATA = ET.QName(NS_OPF, 'metadata')
TITLE = ET.QName(NS_DC, 'title')
et = ET.Element(PACKAGE,
attrib={'version': "2.0",
'unique-identifier': "BookId"},
nsmap=nsmap)
md = ET.SubElement(et, METADATA)
au = ET.SubElement(md, TITLE)
au.text = "A Tale of Two Cities"
s = ET.tostring(et, pretty_print=True)
print(s.decode('utf-8'))
<小时/><小时/>
您可以选择使用lxml.builder.ElementMaker
。这是一个创建示例的一部分的程序。
注释:
dict
来表示不是有效 Python 名称的属性名称。 QName
来表示命名空间限定名称。validator
来验证生成的树。
from lxml import etree as ET
from lxml.builder import ElementMaker
NS_DC = "http://purl.org/dc/elements/1.1/"
NS_OPF = "http://www.idpf.org/2007/opf"
SCHEME = ET.QName(NS_OPF, 'scheme')
FILE_AS = ET.QName(NS_OPF, "file-as")
ROLE = ET.QName(NS_OPF, "role")
opf = ElementMaker(namespace=NS_OPF, nsmap={"opf": NS_OPF, "dc": NS_DC})
dc = ElementMaker(namespace=NS_DC)
validator = ET.RelaxNG(ET.parse("opf-schema.xml"))
tree = (
opf.package(
{"unique-identifier": "uuid_id", "version": "2.0"},
opf.metadata(
dc.identifier(
{SCHEME: "uuid", "id": "uuid_id"},
"d06a2234-67b4-40db-8f4a-136e52057101"),
dc.creator({FILE_AS: "Homes, A. M.", ROLE: "aut"}, "A. M. Homes"),
dc.title("My Book"),
dc.language("en"),
),
opf.manifest(
opf.item({"id": "foo", "href": "foo.pdf", "media-type": "foo"})
),
opf.spine(
{"toc": "uuid_id"},
opf.itemref({"idref": "uuid_id"}),
),
opf.guide(
opf.reference(
{"href": "cover.jpg", "title": "Cover", "type": "cover"})
),
)
)
validator.assertValid(tree)
print(ET.tostring(tree, pretty_print=True).decode('utf-8'))
关于python - 使用 python 生成完整的 XML 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47184919/
具体详细介绍请看下文: 在使用文件进行交互数据的应用来说,使用FTP服务器是一个很好的选择。本文使用Apache Jakarta Commons Net(commons-net-3.3.jar)
我在日志文件中收到这些警告: WARN 2013-01-15 00:08:15,550 org.eclipse.jetty.http.HttpParser- HttpParser Full for
我在使用特定网页时遇到问题。当我按下链接时,我收到应用程序错误(不是 http 错误等,而是应用程序级别错误)。 但是我打开了开发人员工具和网络控制台,我看到没有请求发送到服务器。 所以我双击并选择查
我没有组装经验,但这是我一直在做的。如果在通过程序集中的指针传递参数和调用函数时缺少任何基本方面,我希望输入。 例如,我想知道是否应该还原ecx,edx,esi,edi,。我读到它们是通用寄存器,但我
我没有组装经验,但这是我一直在做的。如果在通过程序集中的指针传递参数和调用函数时缺少任何基本方面,我希望输入。 例如,我想知道是否应该还原ecx,edx,esi,edi,。我读到它们是通用寄存器,但我
我正在尝试创建完整 uiscrollview 的快照,所有内容大小,我已经搜索了很多,并且我在 SO 上找到了一些东西,如下所示: Getting a screenshot of a UIScroll
我想复制一个包含以下结构的Vector,对我来说重要的是在修改复制的 vector 时保持原始Vector完整: public class objet_poid_n { public int
给定一个示例字符串 s = '嗨,我的名字是 Humpty-Dumpty,来自“爱丽丝,爱丽丝镜中奇遇记”',我想将其分成以下 block : # To Do: something like {l =
已关闭。此问题旨在寻求有关书籍、工具、软件库等的建议。不符合Stack Overflow guidelines .它目前不接受答案。 我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以
我正在尝试创建一个正则表达式来查找文本中的 Linux 文件路径,但是正则表达式对我来说非常陌生。我有下面的代码片段,它将识别下面文件结构的开头。 .*(/bin/|/home/).* 完成正则表达式
我正在寻找远程托管的 JPG 的尺寸、宽度和高度。我已经了解了如何通过下载完整图像来执行此操作。 但是,如果我可以通过仅下载足以获取此信息的方式来做到这一点,那将是理想的。 典型的图像大小为 200K
有没有办法让下面的代码: import traceback def log(message): print "%s: %s" %(traceback.extract_stack()[0:-1]
关闭。这个问题需要更多focused .它目前不接受答案。 想改进这个问题吗? 更新问题,使其只关注一个问题 editing this post . 关闭 3 年前。 Improve this qu
git show 显示了修订版中所做的所有更改。但是,它会打印出所有更改——而不仅仅是文件名。 git show --stat 只显示文件名,但它把它们截断了!有没有办法获得已更改文件名的完整列表?
Closed. This question does not meet Stack Overflow guidelines。它当前不接受答案。 想要改善这个问题吗?更新问题,以便将其作为on-topi
当我在模板中调用我的模型 get_absolute_url 方法时,我想要一个绝对/完整的 url。在我的入门模型中,我有以下内容: def get_absolute_url(self): r
我正在使用 jQuery 1.5.1 这是我的代码: $('.cellcontent').animate({ left: '-=190'}, { easing: alert('start
我正在使用下面的方法删除条形图并使用新数据更新条形图,但这样做时出现了一个小故障/完整的图表消失 1 秒,直到加载新数据。但是是否可以通过仅增加/减少柱形而不实际消失图表来实现相同的目的。 d3.se
基于 this question 中的讨论,任何人都可以提供代码或代码链接,显示 NumericLiteralX 模块的完整实现(例如 this one )?我对 NumericLiteralX 模块
我的目标是检索网站的 html,并将其转换为可读的String。我下面的代码可以工作,但我遇到了一个技术问题:当我尝试检索 http://time.gov/HTML5 的 html 时,我在 andr
我是一名优秀的程序员,十分优秀!