- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我发布的脚本会很长,请您耐心等待。我相信对于熟悉XML结构复杂性的人来说很容易解决。我有一个高度分层的 XML 文件。我很想基于它制作 sqlite 数据库。到目前为止,我拥有的两个文件从具有此结构的 XML 文件中提取同级信息(注意 - 工作频率从 0 到 4 或 5 不等;节点也可以为空):
<program>
<id>28798031</id>
<programID>12345</programID>
<orchestra>New York Philarmonic</orchestra>
<season>1842-43</season>
<concertInfo>
<eventType>Subscription Season</eventType>
<Location>Manhattan, NY</Location>
<Venue>Apollo Rooms</Venue>
<Date>1842-12-07T05:00:00Z</Date>
<Time>8:00PM</Time>
</concertInfo>
<worksInfo>
<work ID="52446*">
<composerName>Beethoven, Ludwig van</composerName>
<workTitle>SYMPHONY NO. 5 IN C MINOR, OP.67</workTitle>
<conductorName>Hill, Ureli Corelli</conductorName>
</work>
<work ID="8834*4">
<composerName>Weber, Carl Maria Von</composerName>
<workTitle>OBERON</workTitle>
<movement>"Ozean, du Ungeheuer" (Ocean, thou mighty monster), Reiza (Scene and Aria), Act II</movement>
<conductorName>Timm, Henry C.</conductorName>
<soloists>
<soloist>
<soloistName>Otto, Antoinette</soloistName>
<soloistInstrument>Soprano</soloistInstrument>
<soloistRoles>S</soloistRoles>
</soloist>
</soloists>
</work>
</worksInfo>
</program>
我有两个脚本可以从兄弟节点(相同的层次结构级别)中提取数据。
第一
import sqlite3
import xml.etree.cElementTree
def insert_program(db_conn, id, programID, orchestra, season, concertInfo, worksInfo):
curs = db_conn.cursor()
curs.execute("insert into program values (?,?,?,?,?,?)", (id, programID, orchestra, season, concertInfo, worksInfo))
db_conn.commit()
def program_data_from_element(element):
id = element.find("id").text
programID = element.find("programID").text
orchestra = element.find("orchestra").text
season = element.find("season").text
concertInfo = element.find("concertInfo").text
worksInfo = element.find("worksInfo").text
return id, programID, orchestra, season, concertInfo, worksInfo
## add the main loop to get all the programs from the XML file
if __name__ == "__main__":
conn = sqlite3.connect("program.sqlite3")
program = xml.etree.cElementTree.parse("complete.xml")
program = program.findall("program")
for index, element in enumerate(program):
id, programID, orchestra, season, concertInfo, worksInfo = program_data_from_element(element)
insert_program(conn, id, programID, orchestra, season, concertInfo, worksInfo)
第二
import sqlite3
import xml.etree.cElementTree
def insert_work(db_conn, workID, composerName, workTitle, movement, conductorName):
curs = db_conn.cursor()
curs.execute("insert into work values (?,?,?,?,?)", (workID, composerName, workTitle, movement, conductorName))
db_conn.commit()
def work_data_from_element(element):
workID = element.get("ID")
if workID != None:
workID = workID
else:
workID = ''
composerName = element.find("composerName")
if composerName != None:
composerName = composerName.text
else:
composerName = ''
workTitle = element.find("workTitle")
if workTitle != None:
workTitle = workTitle.text
else:
workTitle = ''
movement = element.find("movement")
if movement != None:
movement = movement.text
else:
movement = ''
conductorName = element.find("conductorName")
if conductorName != None:
conductorName = conductorName.text
else:
conductorName = ''
return workID, composerName, workTitle, movement, conductorName
## add the main loop to get all the work information from the XML file
if __name__ == "__main__":
conn = sqlite3.connect("work.sqlite3")
programs = xml.etree.cElementTree.parse("complete.xml")
work = programs.findall("program/worksInfo/work")
for index, element in enumerate(work):
workID, composerName, workTitle, movement, conductorName = work_data_from_element(element)
insert_work(conn, workID, composerName, workTitle, movement, conductorName)
我的问题是——如何将两者连接在一起,以便我可以同时知道节目 ID、季节、工作 ID 和指挥名称等?谢谢!!
最佳答案
每当使用需要扁平化为二维格式(如数据库表)的嵌套分层 XML 文件时,请考虑使用 XSLT 解决方案。据了解,XSLT是一种专用编程语言,旨在转换 XML 文件,与大多数通用语言一样,Python 可以处理 XSLT 1.0 脚本,特别是使用 lxml模块。
因此,对于 program 和 work SQLite 表,请考虑运行以下 XSLT 脚本来转换源 XML 文件,然后使用 XPath(XSLT 的同级)解析数据库将所有内容导入一个 Python 脚本中。顺便说一句,XSLT 是格式良好的 XML 文件,因此可以像任何其他 XML 一样从文件或字符串加载。 XSLT 的优点还在于您可以对可能存在/可能不存在的元素进行硬编码,以便为丢失的节点返回空文本。
对结构进行一些更改:
<concerntInfo>
的所有子项(也许用作单独的表格?)<worksInfo>
来自程序解析,因为它反射(reflect)在工作表<id>
工作解析以用作表中的外键编写XSLT (另存为.xsl文件以便在Python中调用)
<xsl:transform xmlns:xsl="http://www.w3.org/1999/XSL/Transform" version="1.0">
<xsl:output version="1.0" encoding="UTF-8" indent="yes" />
<xsl:strip-space elements="*"/>
<xsl:template match="/">
<program>
<xsl:apply-templates select="program"/>
</program>
</xsl:template>
<xsl:template match="program">
<id><xsl:value-of select="id"/></id>
<programID><xsl:value-of select="programID"/></programID>
<orchestra><xsl:value-of select="orchestra"/></orchestra>
<season><xsl:value-of select="season"/></season>
<concertInfo><xsl:value-of select="concat(concertInfo/eventType, ' ',
concertInfo/Location, ' ', concertInfo/Venue, ' ',
concertInfo/Date, ' ', concertInfo/Time)"/></concertInfo>
</xsl:template>
</xsl:transform>
工作 XSLT (保存为 .xsl 以在 Python 中调用)
<xsl:transform xmlns:xsl="http://www.w3.org/1999/XSL/Transform" version="1.0">
<xsl:output version="1.0" encoding="UTF-8" indent="yes" />
<xsl:strip-space elements="*"/>
<xsl:template match="program">
<data>
<xsl:apply-templates select="worksInfo"/>
</data>
</xsl:template>
<xsl:template match="worksInfo">
<xsl:apply-templates select="work"/>
</xsl:template>
<xsl:template match="work">
<xsl:copy>
<programID><xsl:value-of select="ancestor::program/id"/></programID>
<workID><xsl:value-of select="@workID"/></workID>
<composerName><xsl:value-of select="composerName"/></composerName>
<workTitle><xsl:value-of select="workTitle"/></workTitle>
<movement><xsl:value-of select="movement"/></movement>
<conductorName><xsl:value-of select="conductorName"/></conductorName>
</xsl:copy>
</xsl:template>
</xsl:transform>
Python 脚本
import lxml.etree as ET
import sqlite3
def insert_program(db_conn, id, programID, orchestra, season, concertInfo):
curs = db_conn.cursor()
curs.execute("insert into program values (?,?,?,?,?,?)", (id, programID, orchestra, season, concertInfo))
db_conn.commit()
def program_data_from_element(element):
id = element.find("id").text
programID = element.find("programID").text
orchestra = element.find("orchestra").text
season = element.find("season").text
concertInfo = element.find("concertInfo").text
return id, programID, orchestra, season, concertInfo
def insert_work(db_conn, programID, workID, composerName, workTitle, movement, conductorName):
curs = db_conn.cursor()
curs.execute("insert into work values (?,?,?,?,?)", (programID, workID, composerName, workTitle, movement, conductorName))
db_conn.commit()
def work_data_from_element(element):
programID = element.find("programID").text
workID = element.find("workID").text
composerName = element.find("composerName").text
workTitle = element.find("workTitle").text
movement = element.find("movement").text
conductorName = element.find("conductorName").text
return programID, workID, composerName, workTitle, conductorName, movement
if __name__ == "__main__":
conn = sqlite3.connect("program.sqlite3")
xml = ET.parse("complete.xml")
# PROGRAM PARSE
xslt = ET.parse("program.xsl")
transform = ET.XSLT(xslt)
newdom = transform(xml)
program = newdom.xpath("//program")
for index, element in enumerate(program):
id, programID, orchestra, season, concertInfo = program_data_from_element(element)
insert_program(conn, id, programID, orchestra, season, concertInfo)
# WORK PARSE
xslt = ET.parse("work.xsl")
transform = ET.XSLT(xslt)
newdom = transform(xml)
work = newdom.xpath("//work")
for index, element in enumerate(work):
programID, workID, composerName, workTitle, conductorName, movement = work_data_from_element(element)
insert_work(conn, programID, workID, composerName, workTitle, conductorName, movement)
关于python - 将分层信息从 XML 解析为 sqlite,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38187781/
我正在开发一个 SQLite 数据库。数据库已经填满了,但我想重构它。这是我需要做的一个示例: 我目前有一张 table : CREATE TABLE Cars (ID INTEGER PRIMARY
我正在使用 Mono、SQLite、Dapper 和 Dapper 扩展。我可以从数据库中读取数据,但插入不起作用。我正在使用 sqlite 的 Mono 驱动程序。 错误并不能提供太多信息,至少对我
我有一个使用 SQLite 的 Windows Phone 8 应用程序。该应用程序具有许多数据库功能,并包含一个 sqlite 数据库文件,在运行该应用程序时,该文件将被复制到本地文件夹并进行访问。
为 sqlite 创建索引时有排序顺序。 https://sqlite.org/lang_createindex.html Each column name or expression can be
顾名思义,我怀疑如果有一些引用被删除的表会发生什么,例如表的某些字段的索引。 SQLite是否会自动处理?在执行drop命令之前,数据库所有者是否应注意任何实例? 最佳答案 我认为不需要家政服务。 S
我想知道是否有可能将从计数中获得的整数转换为REAL 类似于以下内容(尽管这不起作用) SELECT CAST (COUNT (ColumnA) AS Count) AS REAL) FROM Tab
我无法在SQLite数据库上执行一些更新。我正在Windows上使用SQLite 3 Shell。 我正在运行以下命令: update resovled_chrom_counts set genus
我知道SQLite中的触发器顺序是不确定的(您不能确定将首先执行哪个触发器),但是表约束和触发器之间的关系又如何呢? 我的意思是,假设我在一个列中有一个UNIQUE(或CHECK)约束,并且在该表上有
我的 CustomTags 表可能有一系列“临时”记录,其中 Tag_ID 为 0,并且 Tag_Number 将有一些五位数的值。 定期,我想清理我的 Sqlite 表以删除这些临时值。 例如,我可
我有A,B,C和D的记录。 我的SQL1 SELECT * FROM main_table order by main_table.date desc limit 2返回A和B。 我的SQL2 SEL
select round(836.0)返回836.0 我如何删除sqlite查询中的尾随零。 836.00应该是836 836.440应该是836.44 最佳答案 如果需要836.44,则需要十进制返
我正在研究RQDA中的文本,并且正在使用Firefox SQLite Manager访问数据库,以便可以更轻松地搜索文件。我创建并填充了虚拟表: CREATE VIRTUAL TABLE texts
我有这样的数据: table1 id | part | price 1 | ox900 | 100 2 | ox980 | 200 和 table2 id | part | price 1
我正在尝试将一些数据插入现有的SQLite表中。该表和数据库是使用相同的API创建的,但是由于某种原因,插入操作无效,并且从不给我任何错误消息。 我正在BlackBerry 9550模拟器上对此进行测
例如,我在名为SALARY的列中插入一个值。如果插入的值大于1000,我想将字符串HIGH插入到RANK列中,否则将插入LOW中。 我可以使用SQLite做到吗? 最佳答案 在插入之前使用触发器,然后
假设我有一个包含三列A,B,C的表t1,其中(A,B)包含唯一键(具有数十万行)。由于90%的查询将采用SELECT C FROM t1 WHERE A =?和B = ?,我想我要为A,B和C提供覆盖
在一个SQLite3数据库中,我有一个表“ projects”,其id字段由以下方式组成: [user id]_[user's project id] 例如,用户ID = 45,这是一些数据: 45_
我了解PRAGMA foreign_key和ON DELETE RESTRICT/NO ACTION的概念,但是我面临的是另一种情况。 我需要删除一个父行,但保持与之关联的子行。例如: CREATE
我的c#应用程序从Web服务1读取文件列表,并将完整的文件名插入table1,然后从第二个Web服务读取list并将它们插入到table2。 这些表具有相同的结构,如下所示: create table
我在以下情况下尝试将Record1的ID更新为Record2的ID: 两个表中的名称相同,并且 在Record2中权重更大。 记录1 | ID | Weight | Name | |----|----
我是一名优秀的程序员,十分优秀!