gpt4 book ai didi

java - 在Java中将HTML解析为字符串

转载 作者:行者123 更新时间:2023-12-01 15:55:22 28 4
gpt4 key购买 nike

我必须获取电子邮件的内容(HTML 格式)并将其保存到一个字符串中,然后解析该字符串以获取所需的详细信息并准备 XML 输出。

我正在使用 JAMES,并且我希望用 Java 来完成它。如何将 HTML 页面转储为字符串?你认为我在解析时不会遇到双引号、空格、反斜杠的任何问题吗?

现在我正在本地系统上测试邮件服务器。我以 HTML 格式从 user1@localhost 向 user2@localhost 发送了一封邮件另一方面,我想转换解析 HTML 页面以创建具有所需值的 XML 文档..

最佳答案

你能尝试一下这个例子吗?转储 html 页面并将该数据写入 data.html 文件。从下面的代码中,您可以将结果附加到 StringBuffer 并替换 html 特殊字符。

public class UrlReadPageDemo {
public static void main(String[] args) {
try {
URL url = new URL("http://example.com");

BufferedReader reader = new BufferedReader(new InputStreamReader(url.openStream()));
BufferedWriter writer = new BufferedWriter(new FileWriter("data.html"));

String line;
while ((line = reader.readLine()) != null) {
System.out.println(line);
writer.write(line);
writer.newLine();
}

reader.close();
writer.close();
} catch (MalformedURLException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
}

}

关于java - 在Java中将HTML解析为字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5180124/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com