gpt4 book ai didi

java - jTidy 在整理 HTML 后不返回任何内容

转载 作者:太空狗 更新时间:2023-10-29 15:51:58 26 4
gpt4 key购买 nike

我在使用 jTidy(在 Android 上)时遇到了一个非常烦人的问题。我发现 jTidy 适用于我测试过的每个 HTML 文档,但以下内容除外:

    <!DOCTYPE html>
<html lang="en">
<head>
<meta charset="utf-8" />

<!-- Always force latest IE rendering engine & Chrome Frame
Remove this if you use the .htaccess -->
<meta http-equiv="X-UA-Compatible" content="IE=edge,chrome=1" />

<title>templates</title>
<meta name="description" content="" />
<meta name="author" content="" />

<meta name="viewport" content="width=device-width; initial-scale=1.0" />

<!-- Replace favicon.ico & apple-touch-icon.png in the root of your domain and delete these references -->
<link rel="shortcut icon" href="/favicon.ico" />
<link rel="apple-touch-icon" href="/apple-touch-icon.png" />
</head>

<body>
<div>
<header>
<h1>Page Heading</h1>
</header>
<nav>
<p><a href="/">Home</a></p>
<p><a href="/contact">Contact</a></p>
</nav>

<div>

</div>

<footer>
<p>&copy; Copyright</p>
</footer>
</div>
</body>
</html>

但是在整理之后,jTidy 什么都不返回(例如,如果包含 Tidied HTML 的字符串被称为结果,result.equals("") == true)

不过我注意到一些非常有趣的事情:如果我删除 HTML 正文部分中的所有内容,jTidy 将完美运行。 中有什么是 jTidy 不喜欢的吗?

这是我使用的 Java 代码:

 public String tidy(String sourceHTML) {
StringReader reader = new StringReader(sourceHTML);

ByteArrayOutputStream baos = new ByteArrayOutputStream();
Tidy tidy = new Tidy();
tidy.setMakeClean(true);
tidy.setQuiet(false);
tidy.setIndentContent(true);
tidy.setSmartIndent(true);

tidy.parse(reader, baos);

try {
return baos.toString(mEncoding);
} catch (UnsupportedEncodingException e) {
return null;
}
}

我的 Java 有问题吗?这是 jTidy 的错误吗?有什么办法可以让 jTidy 不这样做吗? (我无法更改 HTML)。如果这绝对不能解决,还有其他好的 HTML Tidiers 吗?非常感谢!

最佳答案

试试这个:

tidy.setForceOutput(true);

可能存在解析错误。

关于java - jTidy 在整理 HTML 后不返回任何内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8885586/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com