gpt4 book ai didi

java - docx4j:提高性能

转载 作者:行者123 更新时间:2023-11-30 02:14:06 27 4
gpt4 key购买 nike

我正在使用 docx4j 进行一些测试。我需要做的是将复杂的Word文档(2-3页文本、表格、项目符号列表、图像)转换为xhtml。

我举了这个例子:https://github.com/plutext/docx4j/blob/master/src/samples/docx4j/org/docx4j/samples/ConvertOutHtml.java

它工作得很好,我只有两个问题:

  1. 隐藏一个Word文档大约需要30秒。此行占用了 95% 的计算时间:

    wordMLPackage = Docx4J.load(new java.io.File(inputfilepath));

最终目标是创建一个简单的 Web 应用程序,用于获取 Word 文档(每次都不同)并返回 xhtml。用户不能等这么久。有什么办法可以提高性能吗?为什么需要这么长时间(例如 Tika 快了数百倍)?目前我正在我的笔记本电脑 Eclipse IDE 上运行它,无论如何,PC 速度很快,你认为运行服务器端会更好吗?

非常感谢。

最佳答案

加载 JAXB 上下文需要时间。通常只完成一次,因此首次加载会很慢。也就是说,不应该需要 30 秒!在我的老笔记本电脑上,大约需要 5 秒。

您可以启用日志记录以更深入地了解其中有多少是 JAXB Context init。

关于java - docx4j:提高性能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49139930/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com