- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我正在制作一个读取 XML Internet 的 Android 应用程序。此应用程序使用 SAX 来解析 XML。这是我解析部分的代码:
public LectorSAX(String url){
try{
SAXParserFactory spf=SAXParserFactory.newInstance();
SAXParser sp = spf.newSAXParser();
DefaultHandler lxmlr=new LibraryXMLReader() ;
sp.parse(url, lxmlr);
nodo=((LibraryXMLReader)lxmlr).getNodoActual();
}catch(ParserConfigurationException e){
System.err.println("Error de parseo en LectorSAX.java: "+e);
}catch(SAXException e){
System.err.println("Error de sax LectorSAX.java: " + e);
} catch (IOException e){
System.err.println("Error de io LectorSAX.java: " + e);
}
}
问题是发生了SAXException。异常信息如下:
org.apache.harmony.xml.ExpatParser$ParseException: At line 4, column 42: not well-formed (invalid token)
但是,如果我将相同的代码放入普通的 Java SE 应用程序中,则不会发生此异常并且一切正常。
为什么相同的代码在 Java SE 应用程序中运行良好,而不是 Android?。另一方面,如何解决问题?
感谢您的帮助。
问候。
最佳答案
这可能是字符编码问题。
如您所见,无效 token 错误指向第 4 行。
在此行中,您可以找到尖音符号 (Meteorología) 和波浪号 (España)。XML header 显示 ISO-8859-15 编码值。由于它不如 UTF 或 ISO-8859-1 编码常见,因此当 SAXParser 连接并尝试使用系统默认字符集将字节内容转换为字符时,这可能会导致错误。
然后,您需要告诉 SAXParser 要使用哪个字符集。一种方法是传递 InputSource ,而不是 URL,到解析方法。例如:
SAXParserFactory factory = SAXParserFactory.newInstance();
SAXParser parser = factory.newSAXParser();
InputSource is = new InputSource(url);
is.setEncoding("ISO-8859-15");
DefaultHandler lxmlr=new LibraryXMLReader() ;
sp.parse(is, lxmlr);
编辑:Android VM 似乎不支持此编码,抛出 org.apache.harmony.xml.ExpatParser$ParseException: At line 1, column 0: unknown encoding
异常。
作为 ISO-8859-15,它主要与 ISO-8859-1 兼容,除了一些特定字符(如您所见 here ),解决方法是将 ISO-8859-15
值更改为 ISO-8859-1
在 setEncoding 方法中,强制解析器使用不同但兼容的字符集编码:
is.setEncoding("ISO-8859-1");
看起来,由于 Android 不支持声明的字符集,它使用其默认值 (UTF-8),因此解析器无法使用 XML 声明来选择适当的编码。
关于java - 萨克斯 - ExpatParser$ParseException,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8827006/
我正在制作一个读取 XML Internet 的 Android 应用程序。此应用程序使用 SAX 来解析 XML。这是我解析部分的代码: public LectorSAX(String url){
我在处理 xml 文件的一部分时遇到问题。我正在用 sax 和 java 解析它。 我无法获取文本的所有部分(文本开头、文本中间、文本结尾)。 beginning of the text
有没有办法从内容处理程序中停止解析?还是抛出异常是唯一的方法? 请注意,我正在使用 xml.sax.parseString。 最佳答案 记录了 Python 的 SAX 内容处理程序的完整 API h
我是一名优秀的程序员,十分优秀!