- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
这里是 Python 新手。我一直在为工作中的项目开发一个将 XML 转换为 CSV 的小脚本。已解析到内存中的 XML 数据中有 406 个元素,每个元素有 21 个索引字段是该元素的子元素,总共有 8,526 个索引字段。
在给定元素的这 21 个索引字段中,我想提取第 0、1、2、3、5、6、7 和 8 项。
我创建了一个循环(类似于下面的代码)来执行以下操作:
i = 0
files = 406
docrange = 8526
iterstep = 21
pad = '","'
for docs in range(i, docrange):
string1 = str('"'+indexfields[iterstep])+pad)
string2 = str(indexfields[iterstep+1])+pad)
string3 = str(indexfields[iterstep+2])+pad)
string5 = str(indexfields[iterstep+3])+pad)
string6 = str(indexfields[iterstep+5])+pad)
string7 = str(indexfields[iterstep+6])+pad)
string8 = str(indexfields[iterstep+7])+pad)
string9 = str(indexfields[iterstep+8])+pad)
strung = string1+string2+string3+string5+string6+string7+string8+string9
print strung
iterstep = (iterstep + 21)
i = (i + 1)
当我进入这个循环时出现错误:
Traceback (most recent call last):
File "Path/To/My/script.py", line 55, in <module>
string1 = (str(indexfields[iterstep])) IndexError: list index out of range
根据我收集到的信息,我不认为我正在修改我正在迭代的列表,正如 Stack Overflow 上处理此错误的其他线程似乎表明的那样。
虽然我知道有更优雅的方式来编写上面的代码,但我希望将 XML 数据快速转换为 CSV,并且需要完成这项工作。
Edit1:这可能不是合适的地方,但这是从中提取索引信息的 Files.xml 的示例。还有另一个 XML 文件与 Files.xml 一起使用,如果需要,我也可以发布它。
<?xml version="1.0" encoding="utf-8"?>
<ArrayOfFile xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"xmlns:xsd="http://www.w3.org/2001/XMLSchema">
<File>
<ExtendedProperties />
<ID>7514</ID>
<SyncFlag>Edit</SyncFlag>
<CustomSort />
<ViewerContext>None</ViewerContext>
<ProjectID>1</ProjectID>
<BoxID>0</BoxID>
<FileID>7514</FileID>
<FilePtr>0</FilePtr>
<Status>Active</Status>
<KeyValue />
<KeyVisualValue />
<Field>
<string>Some words that I would like to pull1</string>
<string>Some words that I would like to pull2</string>
<string>Some words that I would like to pull3</string>
<string>Some words that I would like to pull4</string>
<string>Nonsense</string>
<string>Some words that I would like to pull5</string>
<string>Some words that I would like to pull6</string>
<string>Some words that I would like to pull7</string>
<string>Some words that I would like to pull8</string>
<string>Some words that I would like to pull9</string>
<string>Nonsense</string>
<string>Nonsense</string>
<string />
<string />
<string />
<string />
<string />
<string />
<string />
<string />
<string />
</Field>
<Notes />
<DateStarted>2015-07-16T11:02:00</DateStarted>
<DateChanged>2015-12-09T14:46:58.7335221-05:00</DateChanged>
<ChangedBy>1</ChangedBy>
<Destruction>1990-01-01T01:00:00</Destruction>
<LabelPrinted>1990-01-01T01:00:00</LabelPrinted>
<SaveStyle>NewFile</SaveStyle>
<SaveNotesOnly>false</SaveNotesOnly>
<FileVerifyLevels>0</FileVerifyLevels>
<RemoteID>1</RemoteID>
</File>
这是来自 Documents.xml 文件的片段:
<?xml version="1.0" encoding="utf-8"?>
<ArrayOfDocument xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:xsd="http://www.w3.org/2001/XMLSchema">
<Document>
<ID>262601</ID>
<SyncFlag>Edit</SyncFlag>
<CustomSort />
<ViewerContext>None</ViewerContext>
<FileID>1647</FileID>
<RelProjectID>0</RelProjectID>
<ArchiveID>0</ArchiveID>
<Archive />
<DocumentID>262601</DocumentID>
<Status>Active</Status>
<Separator>Some words to pull</Separator>
<Divider>Some words to pull</Divider>
</Document>
编辑2:你们都做出了很好的回应,我发现我最初的错误是由于迭代值最初设置为 21 而不是 0。我需要更多有关此软件的指导,打开一个新线程会更好吗?
最佳答案
编辑:您在这里的主要重点应该是学习如何阅读堆栈跟踪。这告诉您的是,在某个循环之后,您正在尝试访问尚未填充的索引。边走边打印索引,看看会发生什么。
对于这方面的 future 工作,我建议使用 XML 解析来代替它。
您应该动态地处理这种转换,而不是总是假设会有 x 个元素。
Python 内置了解析 XML 和使用 Xpath 的模块。 https://docs.python.org/2/library/xml.etree.elementtree.html
这使您能够解析单个节点、访问属性等。
关于python - 遍历包含 8526 个项目的列表,获取索引超出范围错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35070839/
在文档中我们可以找到 The limits are based on a moving window that tracks the number of requests you send per h
我试图了解使用 Windows Azure 托管 Web 服务的正确方法。在阅读了一些可用的文档后,我已经达到以下几行: Windows Azure takes the following actio
我正在使用 unboundid ldap sdk 来执行 ldap 查询。运行 ldap 搜索查询时遇到一个奇怪的问题。当我对包含 50k 个条目的组运行查询时出现异常。我的异常(exception)
我有以下 docker-compose 文件: version: "2.4" services: auto_check: image: python mem_limit: 97M
我有副本集(托管在亚马逊上),其中有: 主要 中学 仲裁者 它们都是 3.2.6 版本,这个副本正在我的分片集群中创建一个分片(如果这很重要,尽管我认为它不重要)。 当我在 primary 上键入 r
我知道在 C++ 中访问缓冲区边界是未定义的行为。 这是来自 cppreference 的示例: int table[4] = {}; bool exists_in_table(int v) {
嗨,我有一个表单的 div。我希望当鼠标离开 div 时禁用单击事件。所以我尝试了这个,但它不起作用,div 仍然可以点击。有什么想法吗?? var flag = false; $("#foo").l
我正在使用我的客户端获取有关存储在我的 Swift 对象存储中的某个文件的一些信息,该文件可以通过 REST Api 访问。在 Swift 中,指向指定对象的 HEAD 方法和 url 返回它的元数据
如何在 Excel 的 CONCATENATE 函数中使用超过 255 个字符?我实际上也在 EXCEL 的 HYPERLINK 函数中使用 CONCATENATE 函数。一个例子如下: =HYPER
在 java 6 web 应用程序中,我尝试从执行的命令中检索大量输出。我在 javaworld article 上“借用/窃取/基于”它。我面临的问题是,由于输出被截断,长度似乎超出了大小限制。我已
我有一个更改事件,当选择框更改时会触发该事件。然而,选择框位于被替换的 div 内,因此会重新生成选择框。由于此错误可能是由于无限循环造成的,因此我猜测创建选择框时也必须触发我的触发事件。我尝试了很多
我正在 visual studio 2013 中用 c# 创建一个网络服务。我已连接到数据库并使用以下代码返回 json。 [WebMethod] [ScriptMethod(ResponseForm
我使用 php 脚本解析远程 xml 文件并将网页上的输出打印到 div 中。由于我需要输出必须与当前播放的轨道同步,所以我使用 Javascript 每 20 秒重新加载一次 div 内容。在测试页
#define MAX_BUFF_SIZE 64 char input[MAX_BUFF_SIZE]; int inSize = read(0, input, MAX_BUFF_SIZE); if
我在申请公司时遇到了问题。 我将总结系统的关键要素: 我公司的系统几年前就在 Windows XP 和 7(家庭版、专业版、基本版)机器上运行。 它是用 .NET 4.0 编写的,基于 WCF。 它使
我有一个渲染循环,用于监听数位板输入并从顶点/索引缓冲区(以及其他内容)中绘制。顶点数据可以增长,当它达到一定水平时,DispatchMsg(&msg) 会遇到这种情况: Unhandled exce
我通过 Postgres JDBC 驱动程序使用 Java 1.7 和 Postgres。将从 Web 服务使用数据库连接。在测试中,我得到了以下错误: FATAL: connection limit
我想知道当超过 Firebase 实时数据库的限制时会发生什么。问题是我知道我可以拥有的最大连接数仅为 100。现在,假设我的 Android 应用程序有 1,000 个活跃用户,并且我实现了实时数据
我正在将一组图像上传到我的 node.js Express 服务器,但收到错误 - “错误:超出 maxFieldsSize”。看起来默认的 maxFieldsSize 是 2MB。我需要能够上传最多
我正在使用 Django 构建一个小型 Web 项目,该项目有一个包含 ImageField 的模型 (Image)。当我尝试使用管理界面上传图片时,我遇到了这个问题(删除了个人身份信息): Runt
我是一名优秀的程序员,十分优秀!