gpt4 book ai didi

java - MS Word 文档到 RTF 文档

转载 作者:行者123 更新时间:2023-12-01 16:09:19 28 4
gpt4 key购买 nike

我有一个问题:我的应用程序必须将 ms word 文档(从另一个系统导入)转换为 rtf 文档,以便使用 OOo API 进行操作并避免错误(由于编码不兼容的原因)。

请问:如何直接从 Java 应用程序操作 ms word 文档?有 API(如 POI 或 OOo)允许我在没有任何编码不兼容的情况下完成我的工作吗?

我的系统在 Linux 服务器计算机上运行(例如所有公共(public)生产系统),并且我只安装了 OOo。

使用 OOo java API,我可以打开、操作和保存文档,但是,在最后一段时间里,我看到了很多有关 Ms Word 封闭编码和 OOo 打开文档格式编码之间编码不兼容的问题(我指的是作家)。在许多情况下,具有特定项目符号的列表(例如,“-”或嵌套列表)、页码(例如,1 of x 格式)和许多其他格式选项,输出文档(来自操作)显示许多错误,原因如下:我认为,两种编码格式之间不兼容。

现在,我正在研究 Apache POI 功能,以便了解是否可以用它打开 Ms Word,并将文档保存为 RTF 格式,即交换格式能够将不兼容性降低到最低程度。

你也有同样的问题吗?你能给我推荐一个更强大的 POI Java 开源库吗?或者,您能否建议我使用 POI+iText 等组合方法来执行 ms word 到 rtf 的转换步骤?

最佳答案

当我被要求提供一种可靠地将文档转换为 tiff 的方法时,我做了一些研究。有许多库 - 无论是免费的还是商业的,都声称能够呈现 ms.docs。它们都无法提供 100% 准确的渲染。

我必须这样做的方法是在包装器中运行 MS Word,并通过 OLE 自动化操作它来完成我需要的操作。这(在后台运行 Word)本身有一些问题,但通过深思熟虑的设计,您可以让它发挥作用。

您的案例比我的更容易,因为您所需要做的就是打开文档,然后将其另存为。

编辑

@Paolo - 就是这样。我也经历过同样的事情——评估各种包,包括 OO,发现它们不太精确。当然,这完全取决于您的客户对文档格式的严格程度。我的非常挑剔 - 对边距大小和图片位置都非常挑剔。

另一种选择是给出(并获得批准)不精确的列表。不幸的是,每出现一个新文档,您就有机会遇到新文档

关于java - MS Word 文档到 RTF 文档,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1809654/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com