java - 如何抑制java xpath错误-6ren

java - 如何抑制java xpath错误

转载作者：行者123 更新时间：2023-12-01 05:01:50

25

4

当我运行下面的代码时，我收到:

[Fatal Error] :1:1: Content is not allowed in prolog.
org.xml.sax.SAXParseException; lineNumber: 1; columnNumber: 1; Content is not allowed in prolog.

我知道字符串 html 不允许包含内容，但我想抑制所有错误。

import java.io.ByteArrayInputStream;
import java.io.InputStream;

import org.w3c.dom.*;
import org.xml.sax.InputSource;

import javax.xml.xpath.*;
import javax.xml.parsers.*;
public class Test {

    public static void main(String[] args){
        String html="---<html><div id='teste'>Teste</div><div id='ola'>Ola tudo ebm!</div></html>";

        try{

            XPath xpath = XPathFactory.newInstance().newXPath();
            String xpathExpression = "//div[@id='ola']";

            InputStream is = new ByteArrayInputStream(html.getBytes()); 
            InputSource inputSource = new InputSource(is);

            NodeList nodes = (NodeList) xpath.evaluate
            (xpathExpression, inputSource, XPathConstants.NODESET);

            int j = nodes.getLength();

            for (int i = 0; i < j; i++) {
                System.out.println(nodes.item(i).getTextContent());
            }

        } catch (Exception e) {
            e.printStackTrace();
        }

    }
}

最佳答案

首先，XML 与 HTML 不同，XPath 工作在 XML 数据模型上。

为了解决这个问题，您必须找到其他方法来解析输入流，因为当您解析该字符串时，调用的解析器是 XML 解析器，而 XML 解析器没有“忽略错误” ” 根据定义的选项。只允许有效输入；解析器的规范表明，格式不正确的输入应该导致致命异常。

因此，另一种选择是使用不同的解析器。那里有几个。例如，您可以使用 JTidy 。尽管它将 HTML 解析为 HTML DOM，但使用一点粘合代码就可以将其转换为适合解析。请参阅Question 3361263, Library to query HTML with XPath in Java .

关于java - 如何抑制java xpath错误，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/13300402/

25

4

0

文章推荐： javascript - pdf生成后如何打开打印对话框？

文章推荐： assembly - 编程语言如何存储数组

文章推荐： java - Digital Persona one touch sdk-无法在java中执行验证

angular - 抑制 "Circular dependency detected"抑制 Angular 6 中的警告
我收到警告 Circular dependency detected! 在 Angular 6 中，我知道为什么会出现这个问题，但这根本不是问题。我目前正在使用 SVG，按照我的逻辑，我会防止可能出
gcc - AddressSanitizer 抑制
我试图抑制 clang/gcc 中地址清理程序发出的警告我的源文件如下所示: int foo(){ double bar[] = {7,8}; return bar[3]; } int ma
generics - 具有高阶功能的异常处理/抑制
我在微服务架构中有一个应用程序。该应用程序从不同的源获取数据，并且从其他各种应用程序获得许多不同的错误响应。某些异常(例如404-Not Found异常)可以引发并返回给最终用户，但其他异常(错误请求
read_excel 在消息中读取 - 抑制？
我喜欢使用 readxl包裹。但是，我一直将它用作 RMarkdown 文档和一些 read_excel() 文档的一部分。读入文件时的消息在进行分析时很有用，但在尝试呈现分析时则不然。所以问题是，在
jaxb - 抑制 Javadoc
当我编译 JAXB 模式时，生成的类用通用 Javadoc 注释进行修饰。是否有可能以某种方式抑制生成这些评论？最佳答案 Annotation to disable JavaDocs Not if
java - 抑制 GUI？
我正在尝试运行专为 Vuze 设计的插件使用Java。为此，我使用这样的命令: /home/x/jre1.6.0_14/bin/java -Dazureus.config.path=/home/x/p
python - 抑制 python 中的弃用
所以 - 我正在使用库 pyminizip - 这是我发现创建受密码保护的 zip 文件的唯一方法。当我使用它时，我收到一个弃用警告:“#”格式需要 PY_SSIZE_T_CLEAN。现在，我无法控
python - 抑制 geopandas 情节图例中的科学记数法
这个问题在这里已经有了答案: Is ticklabel_format broken? (1 个回答) 关闭 2 年前。我是 geopandas 的新手，我正在尝试用常规记数法而非科学记数法绘制带有
valgrind - 抑制 Valgrind 中潜在的内存泄漏
我从 Valgrind 得到以下日志: MPK ==5263== 4 bytes in 1 blocks are still reachable in loss record 1 of 84 ==52
php - 抑制 mediawiki 中的警告
有什么方法可以抑制 mediawiki 中的贬低警告吗？例如我在个人 wiki 站点的某些页面顶部收到此消息。 Deprecated: Use of MWNamespace::getSubject w
java - 抑制 ScheduledThreadPoolExecutor 中的冗余作业
我正在使用 ScheduledThreadPoolExecutor 执行定期任务。执行必须是周期性的，而不是固定的延迟。我遇到了以下问题:考虑一个任务的时间为 1 分钟。如果任务需要 5 分钟才能
r - 抑制 R 中的一些消息但留下其他消息？
我是使用 RScaLAPACK 的 R 新手，每次我生成一个新的进程网格时，我都会收到一条消息。 > sla.gridInit(2) [1] "RScaLAPACK:Process Grid Init
r - 抑制 r 中的读取器解析问题
我目前正在使用包 readr 读取文件.这个想法是使用 read_delim逐行读取以查找非结构化数据文件中的最大列数。代码输出有 parsing问题。我知道这些并将在导入后处理列类型。有没有办法关闭
php - 抑制 PHP 中的解析错误
所以我试图防止 fatal error 阻止我的脚本运行所以我将错误报告设置为0: error_reporting(0); 然后我添加了一些垃圾代码.. junk code~~~~trolololo
r - 抑制 R 中的固定效应系数
在使用 summary() 函数(例如，stata 中的 absorb() 函数的等价物)时，是否有一种方法可以抑制线性模型中固定效应的系数。例如，我希望汇总函数只输出截距和 x，而不是因子的系数和标
scala - 抑制 sbt 调试输出
如何抑制 SBT 的调试消息？它们被记录到标准输出，所以运行一个项目会产生这个: $ cat src/main/scala/Hello.scala object Hello { def main(
doxygen - 抑制 Doxygen 警告
有没有办法抑制 Doxygen 对特定文件发出“未记录”警告？我的项目有几个自动生成的代码头，导致它抛出成百上千的错误，难以筛选。最佳答案如 documentation 中所述，有一个配置选项。
r - 抑制 R 中的进度条
R的eHOF包中的HOF函数会自动生成进度条。函数中没有关闭进度条的参数。有什么办法可以抑制函数外的进度条的生成？ (我正在应用该功能数百次，目前进度条除了淹没我的屏幕外没有任何作用。) 最佳答案
ios - 抑制 Xcode 中已弃用的警告
随着所有 SDK 的出现，能够方便地针对多个 SDK 和平台进行构建。然而，从 3.2 跳到 3.0，甚至偶尔跳到 2.x，我经常收到涉及已更改或被取代的方法的弃用警告: warning: 'UIKe
powershell - 抑制 powershell 中的错误并显示自定义错误消息
我创建了一个 PowerShell 脚本，该脚本将为 Cisco Meraki 添加 VPN 连接。脚本本身按预期运行，但如果发生错误，则会出现“已完成”弹出窗口，并在 PS 窗口中显示错误消息。

首页

博学

6Ren·AI

商城

java - 如何抑制java xpath错误