java - Android Studio - 访问维基百科页面时出现 SAXParseException-6ren

java - Android Studio - 访问维基百科页面时出现 SAXParseException

转载作者：行者123 更新时间：2023-12-01 10:11:10

25

4

我的 Android Studio 遇到了一个非常不寻常的问题，该问题是在 4 天前开始的(我假设是在更新之后)。问题是:尝试读取(解析)任何页面时都会抛出异常，无论是维基百科、谷歌、雅虎、一些java文档...，但是当我在Eclipse中编写相同的代码时，一切都工作正常。因此，这是调用类( Activity )的代码:

    `new Thread(new ImgCrawlerThread("https://en.wikipedia.org/wiki/Batman_(comic_book)")).start();`

这是来自 ImgCrawlerThread 的代码:

    public void run() {
    // TODO Auto-generated method stub
    try {
        //Thread.sleep(60000);
        URL url = new URL(httpsurl);
        HttpsURLConnection https = (HttpsURLConnection)url.openConnection();
        DocumentBuilder db;
        DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
        db = dbf.newDocumentBuilder();
        Document doc = db.parse(https.getInputStream());
        NodeList nodes = doc.getElementsByTagName("img");
        System.out.println(nodes.item(0).getAttributes().getNamedItem("src").getNodeValue());
        https.disconnect();
    } catch (MalformedURLException e) {
        // TODO Auto-generated catch block
        e.printStackTrace();
    } catch (IOException e) {
        // TODO Auto-generated catch block
        e.printStackTrace();

    } catch (ParserConfigurationException e) {
        // TODO Auto-generated catch block
        e.printStackTrace();
    } catch (SAXException e) {
        // TODO Auto-generated catch block
        e.printStackTrace();
    }

}

Android Studio中的异常是从代码中抛出的:文档 doc = db.parse(https.getInputSteam())

Eclipse 执行的结果如下所示:

//upload.wikimedia.org/wikipedia/en/thumb/4/4d/BatmanComicIssue1%2C1940.png/250px-BatmanComicIssue1%2C1940.png

来自 Android Studio:

     `org.xml.sax.SAXParseException: expected: /img read: a (position:END_TAG </a>@43:317 in java.io.InputStreamReader@1f213bb3) 
System.err:     at org.apache.harmony.xml.parsers.DocumentBuilderImpl.parse(DocumentBuilderImpl.java:146)
System.err:     at javax.xml.parsers.DocumentBuilder.parse(DocumentBuilder.java:107)
System.err:     at com.finki.filip.crawlingtest.CrawlerAsync.doInBackground(CrawlerAsync.java:61)
System.err:     at com.finki.filip.crawlingtest.CrawlerAsync.doInBackground(CrawlerAsync.java:37)
System.err:     at android.os.AsyncTask$2.call(AsyncTask.java:288)
System.err:     at java.util.concurrent.FutureTask.run(FutureTask.java:237)
System.err:     at android.os.AsyncTask$SerialExecutor$1.run(AsyncTask.java:231)
System.err:     at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1112)
System.err:     at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:587)
System.err:     at java.lang.Thread.run(Thread.java:818)`

我将感谢任何能给我关于这个非理性问题的理性意见的人!!!

最佳答案

HTML != XML

XML 解析器对于输入语法非常严格。另一方面，网络浏览器必须应对不匹配的标签等问题，并且更加宽容。因此，尝试使用 XML 解析器解析网页将是一场失败的战斗。

甚至 Google 在 Android 内部也存在同样的问题。如果您查看将 HTML 转换为标记的 SpannableString 的 Html.fromHtml() 的源代码，您会发现它们使用一个名为 jsoup 的开源库。这允许像 XML 一样解析“tag-soup”HTML。它会利用真正损坏的 HTML 标记为您创建一个合理的 DOM。我建议您查看适用于您的应用程序的 jsoup。

关于java - Android Studio - 访问维基百科页面时出现 SAXParseException，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/36104661/

25

4

0

文章推荐： perl - 在 Perl 中使用变量作为方法名

文章推荐： java - 打印字符数组输出空框？

文章推荐： sql - View 、存储过程或表定义函数

文章推荐： java - 将对象添加到数组列表中可能存在逻辑问题

android - Android:Android Studio中的Gradle错误
我最近在/ drawable中添加了一些.gifs，以便可以将它们与按钮一起使用。这个工作正常(没有错误)。现在，当我重建/运行我的应用程序时，出现以下错误: Error: Gradle: Execu
android - (Android) 在内部存储中查找路径/Android
Android 中有返回内部存储数据路径的方法吗？我有 2 部 Android 智能手机(Samsung s2 和 s7 edge)，我在其中安装了一个应用程序。我想使用位于这条路径中的 sqlit
android - @android : and ? android 之间有什么区别:
这个问题在这里已经有了答案: What's the difference between "?android:" and "@android:" in an android layout xml f
android - Android 开发手机、Android 普通手机和 Android root 手机之间的区别
我只想知道 android 开发手机、android 普通手机和 android root 手机之间的实际区别。我们不能从实体店或除 android marketplace 以外的其他地方购买开发手
android - Android-android-apt插件与Android Gradle插件不兼容。
自Gradle更新以来，我正在努力使这个项目达到标准。这是一个团队项目，它使用的是android-apt插件。我已经进行了必要的语法更改(编译->实现和apt->注释处理器)，但是编译器仍在告诉我存在
android - Android Spinner未填充| Android Kotlin
我是android和kotlin的新手，所以请原谅要解决的一个非常简单的问题! 我已经使用导航体系结构组件创建了一个基本应用程序，使用了底部的导航栏和三个导航选项。每个导航选项都指向一个专用片段，该片
android - Facebook android，获取应用程序流 - Android
我目前正在使用 Facebook official SDK for Android . 我现在正在使用高级示例应用程序，但我不知道如何让它获取应用程序墙/流/状态而不是登录的用户。这可能吗？在那种情
android - 无法在 Android 手机中下载文件 - Android..？
我在下载文件时遇到问题，我可以在模拟器中下载文件，但无法在手机上使用。我已经定义了上网和写入 SD 卡的权限。我在服务器上有一个 doc 文件，如果用户单击下载。它下载文件。这在模拟器中工作正常但
android - android :layout_gravity and android:gravity之间的区别
这个问题在这里已经有了答案: What is the difference between gravity and layout_gravity in Android? (22 个答案) 关闭 9
android - Android 缓存内存和 Android 应用程序缓存内存有什么区别
任何人都可以告诉我什么是 android 缓存和应用程序缓存，因为当我们谈论缓存清理应用程序时，它的作用是，缓存清理概念是清理应用程序缓存还是像内存管理一样主存储、RAM、缓存是不同的并且据我所知，缓
android - Android 应用程序能否知道另一个 Android 应用程序何时运行？
假设应用程序 Foo 和 Eggs 在同一台 Android 设备上。任一应用程序都可以获取设备上所有应用程序的列表。一个应用程序是否有可能知道另一个应用程序是否已经运行以及运行了多长时间？最佳答案
android - Webrtc Android 到 Android？
我有点困惑，我只看到了从 android 到 pc 或者从 android 到 pc 的例子。我需要制作一个从两部手机 (android) 连接的 android 应用程序进行视频聊天。我在想，我知道
android - Android 的锁屏无法使用 Android 正常工作
用于使用 Android 以编程方式锁定屏幕。我从 Stackoverflow 之前关于此的问题中得到了一些好主意，并且我做得很好，但是当我运行该代码时，没有异常和错误。而且，屏幕没有锁定。请在这段代
android - android :layout_alignParentTop and android:layout_alignParentStart之间的区别
文档说: android:layout_alignParentStart If true, makes the start edge of this view match the start edge
android - android :layout_width and android:width有什么区别
我不知道这两个属性和高度之间的区别。以一个TextView为例，如果我将它的layout_width设置为wrap_content，并将它的width设置为50 dip，会发生什么情况？最佳答案
android - android :noHistory and android:finishOnTaskLaunch之间的关系
这两个属性有什么关系？如果我有 android:noHistory="true"，那么有 android:finishOnTaskLaunch="true" 有什么意义吗？最佳答案假设您的应用中有
android - 什么时候使用 "?android"或 "@android"？
我是新手，正在尝试理解以下 XML 代码: 查看 developer.android.com 上的文档，它说“starStyle”是 R.attr 中的常量， public static final
android - android :width and android:layout_width之间的区别
在下面的代码中，为什么当我设置时单选按钮的外观会发生变化 android:layout_width="fill_parent" 和 android:width="fill_parent" 我说的是
android - Android 移动应用程序可以在 Android 平板电脑上运行吗？
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开，visit the help center . 关闭 9
android - 如何在 android 中保存函数调用并在以后再次使用它 Android
假设我有一个函数 fun myFunction(name:String, email:String){}，当我调用这个函数时 myFunction('Ali', 'ali@test.com ') 如何

首页

博学

6Ren·AI

商城

java - Android Studio - 访问维基百科页面时出现 SAXParseException