python - ElementTree中fromstring函数的上限-6ren

python - ElementTree中fromstring函数的上限

转载作者：太空宇宙更新时间：2023-11-03 19:17:27

26

4

我在 Windows 32 位 PC 上使用 Python 2.4 版本。我正在尝试使用 ElementTree 模块解析一个非常大的 XML 文件。我从 effbot.org 下载了该模块的 1.2.6 版本。

为了我的目的，我遵循了以下代码:

import elementtree.ElementTree as ET

input = ''' 001 Chuck 009 Brent '''
stuff = ET.fromstring(input)
lst = stuff.findall("users/user")
print len(lst)

for item in lst:
    print item.attrib["x"]

item = lst[0]
ET.dump(item)
item.get("x") # get works on attributes
item.find("id").text
item.find("id").tag

for user in stuff.getiterator('user'):
    print "User" , user.attrib["x"]

ET.dump(user)

如果输入的内容太大，超过 10,000 行，fromstring 函数会引发错误(如下)。谁能帮我纠正这个错误？

这是生成的错误:

Traceback (most recent call last): File "C:\Documents and Settings\hariprar\My Documents\My files\Python Try\xml_try1.py", line 16, in -toplevel- stuff = ET.fromstring(input) File "C:\Python24\Lib\site-packages\elementtree\ElementTree.py", line 1012, in XML return api.fromstring(text) File "C:\Python24\Lib\site-packages\elementtree\ElementTree.py", line 182, in fromstring parser.feed(text) File "C:\Python24\Lib\site-packages\elementtree\ElementTree.py", line 1292, in feed self._parser.Parse(data, 0) ExpatError: not well-formed (invalid token): line 2445, column 39

最佳答案

看一下 iterparse 函数。它将让您增量地解析输入，而不是将其作为一大块读入内存。

此处描述:http://effbot.org/zone/element-iterparse.htm

关于python - ElementTree中fromstring函数的上限，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/10916945/

26

4

0

文章推荐： css - 主要内容 div 不会居中

文章推荐： python - 通过crontab安排python脚本

文章推荐： c# - PDFSharp 不工作

rust - 如何实现具有具体生命周期的 FromStr？
我想为一个带有生命周期参数的结构实现FromStr: use std::str::FromStr; struct Foo { bar: &'a str, } impl FromStr for
rust - FromStr 特征不暴露生命周期的原因是什么？
Rust FromStr trait 是这样定义的 pub trait FromStr { type Err; fn from_str(s: &str) -> Result; } 它没
rust - 如何实现具有具体生命周期的 FromStr？
我想为一个带有生命周期参数的结构实现FromStr: use std::str::FromStr; struct Foo { bar: &'a str, } impl FromStr for
qt - 如何使用 QDateTime::fromString？
我现在，这个问题听起来很愚蠢，但我无法让它发挥作用。最坏的例子: QString time_format = "yyyy-MM-dd HH:mm:ss"; QDateTime a = QDateTi
python - numpy fromstring 空字符串分隔符
当我打电话时: np.fromstring('3 3 3 0', sep=' ') 返回 array([ 3., 3., 3., 0.]) 由于默认情况下，sep=''，我希望以下调用返回相同的
javascript - ReactJS 渲染附加跨度 fromstring
我和this question有类似的问题我正在尝试转换创建一个自定义组件，它将每个字符串转换为不同的颜色例如输入“A B C D” 输出 A B C D(不能在这个问题上碰碰运气，所以我用 Bo
rust - FromStr & FromErr 解析字符串时出现问题
我正在尝试编写一个简单的 Rust 函数来解析字符串并创建结构。我正在使用 Result 作为解析结果。我希望它适用于多种数字类型(整数和 float )。我正在使用相同的 approach as u
Java 对象的 fromString 方法？
所以我意识到 Object 类中有一个 toString() 方法。但是，如何设置 fromString() 方法？ public String toString() { return "";
python - 为什么 numpy.fromstring 读取数字是错误的？
我正在编写使用 numpy.fromstring 从 xml 元素文本读取数组的代码。它运行没有错误，但它读取的内容非常奇怪。例如 import numpy as np nr = 24 r_str
java - 如何正确使用 UUID.fromString 方法？
我正在尝试读/写这些 ble 特征: 现在，我正在尝试阅读 AA01* 我正在使用 this library去做吧。这是我的代码: private void connectToSensorTag(R
rust - 为自定义 &[u8] 类型实现 FromStr
这是一个二人组。理想情况下，我想实现 FromStr 特性，但不管有没有它，我都需要实现 from_str()。 CqlString 由一个 u16(两个 u8)后跟原始字符串的原始字节组成。下面
generics - 解析数字的通用函数因 "FromStr is not implemented"而失败
我的 Rust 代码中有这个通用函数: fn test(text: &str) -> T { text.parse::() } 这个想法是调用者会做类似的事情 test::("2313");
rust - Rust 的通用 FromStr 对象可以做什么？
Rust 的 str类有一个 parse返回 FromStr 的方法目的。 parse是模板化的，因此从 str 解析的类型可以手动指定，例如"3".parse::()评估为(一个 Result 对象
c++ - QDateTime::fromString 不接受我的 QString？
我有一个 .txt 文件，其中包含如下所示的行: 2011-03-03 03.33.13.222 4 2000 信息业务......等 blabla 2011-03-03 03.33.13.333 4
python - 是否有内置函数来执行 numpy.fromstring 的反向操作？
我刚刚了解到 numpy.fromstring() 是一个方便的函数: a = ('1 2 3') # convert to list of numbers b = np.fromstring(a,
python - 使用带有 lxml 前缀的 fromstring()
我有一个变量 ele。我试图将一个子节点附加到 ele 上，该节点的标签中包含 namespace 前缀(称为 style)。 ele 似乎知道这个前缀，如以下行: print(ele.nsmap['
python - numpy.fromstring 中的 ValueError
我想将这些字符串值转换为 int16 数据类型的 numpy 数组 import numpy as np raw=b'' w="\x01\x02 \x01\x02" w1="\x01\x03 \x04
python - Numpy np.fromstring() 没有按预期工作
我已将一个数组作为字符串保存在文本文件中，希望在从文件读取时能够将其转换回数组: str_arr = "[0.01 0.01 0.01 0.01 0.01 0.01]" num_arr = np.fr
java - UUID.fromString() 返回无效的 UUID？
在我的 Android 应用程序中，我有这种采用 UUID 的方法。不幸的是，当我这样做时: OverviewEvent overviewevent = eventAdapter.getOvervie
java.util.UUID.fromString 不检查长度
当我查看 java.util.UUID.fromString 的实现时，我发现它不检查 UUID 长度。这有什么特别的原因吗？它只检查以“-”分隔的组件。 String[] components =

首页

博学

6Ren·AI

商城

python - ElementTree中fromstring函数的上限