- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
尝试使用 urllib 和 cElementTree 在网络上抓取此 xml 文件。我正在使用 Google App Engine,但我认为该问题与我的平台无关。
这是我的错误:
<type 'exceptions.SyntaxError'>: not well-formed (invalid token): line 1, column 25
Traceback (most recent call last):
File "/base/data/home/apps/metautoit/daily-update.353244196034914877/Start_Update.py", line 25, in main
ShoppingCar.XMLRipper().getNew()
File "/base/data/home/apps/metautoit/daily-update.353244196034914877/updatecars/sitecrawlers/ShoppingCar.py", line 24, in getNew
for carDict in newCars:
File "/base/data/home/apps/metautoit/daily-update.353244196034914877/updatecars/sitecrawlers/ShoppingCar.py", line 67, in _iter_carDicts_in_xml
tree = self.get_xml()
File "/base/data/home/apps/metautoit/daily-update.353244196034914877/updatecars/sitecrawlers/ShoppingCar.py", line 63, in get_xml
return ET.parse(req, parser=parser)
File "<string>", line 45, in parse
File "<string>", line 28, in parse
xml 文件很长,但这里是一个示例:
<?xml version="1.0" encoding="windows-1252"?><veicoli>
<veicolo>
<id><![CDATA[16529]]></id>
<link><![CDATA[http://www.shoppingcar.it/auto_usate_/Chrysler_PT_Cruiser/16529.asp]]></link>
<marca><![CDATA[Chrysler]]></marca>
<modello><![CDATA[PT Cruiser]]></modello>
<versione><![CDATA[2.4 L]]></versione>
<provincia><![CDATA[Padova]]></provincia>
<anno><![CDATA[2006]]></anno>
<mese><![CDATA[4]]></mese>
<chilometri><![CDATA[26000]]></chilometri>
<cilindrata><![CDATA[]]></cilindrata>
<potenza><![CDATA[143]]></potenza>
<alimentazione><![CDATA[Benzina]]></alimentazione>
<cambio><![CDATA[Cambio Automatico]]></cambio>
<colore><![CDATA[nero]]></colore>
<prezzo><![CDATA[14900]]></prezzo>
<immagine><![CDATA[http://www.shoppingcar.it/public/Auto%20Usate/Berline/imagesadv/16529_2.jpg]]>
</immagine>
</veicolo>
</veicoli>
我的(简化的)代码如下所示:
xml_url = "http://www.shoppingcar.it/feed/export_vel.asp?parametro=1"
req = urllib.urlopen(xml_url)
parser = ET.XMLParser(encoding="windows-1252")
tree = ET.parse(req, parser=parser).get_xml()
关键在于:我将其下载并上传为公共(public)保管箱文件。使用这个 url 可以很好地解析 xml。我尝试过不声明编码,并尝试过 windows-1252 和 utf-8 编码。这真的很奇怪,因为第 25 列只不过是“编码”一词的中间。如有任何帮助,我们将不胜感激。
最佳答案
我尝试了你的代码(添加了导入,以便其他人可以尝试):
#!/usr/bin/env python
import xml.etree.cElementTree as ET
import urllib
xml_url = "http://www.shoppingcar.it/feed/export_vel.asp?parametro=1"
req = urllib.urlopen(xml_url)
parser = ET.XMLParser(encoding="windows-1252")
tree = ET.parse(req, parser=parser).get_xml()
它运行得很好。如果您的错误仅发生在服务器上,那么您可能会遇到网页限制并尝试解析错误消息。因此,请确保您实际上正在解析文档(例如 data = req.read()
),然后转储数据并将字符串解析为 xml。
关于python - cElementTree <类型 'exceptions.SyntaxError' > : not well-formed (invalid token),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7407543/
我在 Python 2 中尝试了这段代码: def NewFunction(): return '£' 但我收到一条错误消息: SyntaxError: Non-ASCII character
我正在学习xpath,并且我正尝试从html usint xpath获取一些数据 我发现谷歌浏览器可以选择“复制xpath”,效果很好 但不适用于这个例子 some divs
我是 ruby 的初学者。我想修复其中一个邮件软件中的错误。我应用的修复代码如下: @headers[:recipient] = { "To" => (cc.map do |p|
我是初学者级别的python用户,当我在终端中键入以下内容时: $ pydoc Inleesgenbank.py 我收到以下错误消息: ./Inleesgenbank.py中的问题-:语法无效(Inl
我正在编写用于解析电子邮件的脚本,但是以下部分的for循环上有一些SyntaxError: def main(): writer = csv.DictWriter(open('feature
我正在尝试在python33中创建分发文件,但没有成功。 我用嵌套器名称创建了一个文件夹,并在Windows 8的C驱动程序中放入了python33。 此文件夹有2个文件。 nester.py和set
当我尝试导入NumPy时,突然出现以下错误: 更具体地说,它在我键入时显示: import numpy as np 要不就: import numpy 它也会在Python控制台中发生,如下所示: P
在我的 HTML 文件中,我有一行(如下)通过 WiFi 从设备获取响应并使数据可用于我的 JavaScript,它运行良好,除非响应文本中有错误并停止。 响应是一个代表 JavaScript 变量的
我开始使用 Javascript OOP,我编写了我的第一个类,但我在控制台中收到消息错误 这是类(class): class Quote{ deleteQuote(callback){ $(
我正在使用argparse来解析参数,但是当我得到args.global时,出现了一个奇怪的错误,我不知道我哪里做错了 ... parser.add_argument('-u','--update',
已关闭。这个问题是 not reproducible or was caused by typos 。目前不接受答案。 这个问题是由拼写错误或无法再重现的问题引起的。虽然类似的问题可能是 on-top
我正在使用argparse来解析参数,但是当我得到args.global时,出现了一个奇怪的错误,我不知道我哪里做错了 ... parser.add_argument('-u','--update',
有什么不同?为什么它会在函数 a() 中出错? function a(){ 1 == 1 ? return true: ""; // Uncaught SyntaxError: Unexpe
我有一个 python 脚本,其中包含如下函数参数的类型声明: def dump_var(v: Variable, name: str = None): 据我所知,这是一个为函数设置输入参数类型的有效
我正在尝试从命令行运行 Python 脚本,这是我的脚本: import sys def printsomething(sys.argv): text = str(sys.argv[1])
我在 macbook 上使用终端将数据打印到打开的文件中: >>> out=open("test_output.txt","w") >>> print("hello",file=out) File
我想排除以下代码产生的错误,但我不知道如何。 from datetime import datetime try: date = datetime(2009, 12a, 31) except:
我想在动态生成的列表中放置一个 onclick 事件。我不能按原样使用它,例如 updateRoomID(arg) ,因为它会立即开火。所以我把它放在一个匿名函数中,按照网上各种来源的建议:funct
我有以下脚本: 测试.py: import sys try: import random print random.random() except: print sys.exc
这个问题在这里已经有了答案: "+=" causing SyntaxError in Python (6 个答案) 关闭 3 年前。 在我的代码中有这些行: if numVotes == 0:
我是一名优秀的程序员,十分优秀!