gpt4 book ai didi

java - 在 Apache POI 中使用 WordToHtmlConverter 转换器

转载 作者:行者123 更新时间:2023-12-01 19:11:23 25 4
gpt4 key购买 nike

我正在尝试使用 WordToHtmlConverter 类将 Word 文档转换为 HTML,但文档不清楚。

WordToHtmlConverter 有一个采用 org.w3c.dom.Document 的构造函数,但我不认为它是单词文档。

有没有人有一个关于如何加载word文档并将其转换为html的示例程序。

最佳答案

现在最好的选择可能是查看单元测试,例如 TestWordToHtmlConverter 。这将向您展示如何做到这一点

一般来说,您传入要填充的 xml 文档,让 WordToHtmlConverter 从 Word 文档生成 HTML 到其中,然后将 xml 文档转换为适当的输出(缩进、换行等)

您的代码应该类似于:

    Document newDocument = DocumentBuilderFactory.newInstance()
.newDocumentBuilder().newDocument();
WordToHtmlConverter wordToHtmlConverter = new WordToHtmlConverter(
newDocument );

wordToHtmlConverter.processDocument( hwpfDocument );

StringWriter stringWriter = new StringWriter();
Transformer transformer = TransformerFactory.newInstance()
.newTransformer();
transformer.setOutputProperty( OutputKeys.INDENT, "yes" );
transformer.setOutputProperty( OutputKeys.ENCODING, "utf-8" );
transformer.setOutputProperty( OutputKeys.METHOD, "html" );
transformer.transform(
new DOMSource( wordToHtmlConverter.getDocument() ),
new StreamResult( stringWriter ) );

String html = stringWriter.toString();

关于java - 在 Apache POI 中使用 WordToHtmlConverter 转换器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8242407/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com