- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个问题:我的应用程序必须将 ms word 文档(从另一个系统导入)转换为 rtf 文档,以便使用 OOo API 进行操作并避免错误(由于编码不兼容的原因)。
请问:如何直接从 Java 应用程序操作 ms word 文档?有 API(如 POI 或 OOo)允许我在没有任何编码不兼容的情况下完成我的工作吗?
我的系统在 Linux 服务器计算机上运行(例如所有公共(public)生产系统),并且我只安装了 OOo。
使用 OOo java API,我可以打开、操作和保存文档,但是,在最后一段时间里,我看到了很多有关 Ms Word 封闭编码和 OOo 打开文档格式编码之间编码不兼容的问题(我指的是作家)。在许多情况下,具有特定项目符号的列表(例如,“-”或嵌套列表)、页码(例如,1 of x 格式)和许多其他格式选项,输出文档(来自操作)显示许多错误,原因如下:我认为,两种编码格式之间不兼容。
现在,我正在研究 Apache POI 功能,以便了解是否可以用它打开 Ms Word,并将文档保存为 RTF 格式,即交换格式能够将不兼容性降低到最低程度。
你也有同样的问题吗?你能给我推荐一个更强大的 POI Java 开源库吗?或者,您能否建议我使用 POI+iText 等组合方法来执行 ms word 到 rtf 的转换步骤?
最佳答案
当我被要求提供一种可靠地将文档转换为 tiff 的方法时,我做了一些研究。有许多库 - 无论是免费的还是商业的,都声称能够呈现 ms.docs。它们都无法提供 100% 准确的渲染。
我必须这样做的方法是在包装器中运行 MS Word,并通过 OLE 自动化操作它来完成我需要的操作。这(在后台运行 Word)本身有一些问题,但通过深思熟虑的设计,您可以让它发挥作用。
您的案例比我的更容易,因为您所需要做的就是打开文档,然后将其另存为。
编辑
@Paolo - 就是这样。我也经历过同样的事情——评估各种包,包括 OO,发现它们不太精确。当然,这完全取决于您的客户对文档格式的严格程度。我的非常挑剔 - 对边距大小和图片位置都非常挑剔。
另一种选择是给出(并获得批准)不精确的列表。不幸的是,每出现一个新文档,您就有机会遇到新文档
关于java - MS Word 文档到 RTF 文档,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1809654/
有谁知道将背景颜色应用于表格单元格的 rtf 标签? 我知道表结构: {\rtf1\ansi\deff0 \trowd \clshdng10000\cellx1000 \clshdng10000
MS Exchange/Outlook 消息使用 MAPI 存储数据。一个常见的 MAPI 属性包含消息正文的富文本版本(0x1009、PR_RTF_COMPRESSED、PidTagRtfCompr
我需要以编程方式生成一个 RTF 文档,其中包含一个垂直合并列的表格,例如 ______________________________ | merged | foo | hello |
我正在尝试增加 柜台 使用以下代码在 BIP 报告的 for-each 循环中将变量增加 1。 然而,柜台 无论有多少循环,变量都不会增加。有人可以指导我如何做到这一点。 我也知道 position(
我需要在 RTF 文件中创建一个表。但是我不熟悉 RΤF。以下是这些 RTF 文件应该替换的文本文件示例: GENERAL JOURNAL
我正在尝试手动生成 RTF 文档,最终会以编程方式完成。我计划改进 pyRTF,使其可以生成“目录”,但我认为它不能。 我无法使用 RTF 控制字(\tc、\tcf 和\tcl.)生成目录。 http
如何在 rtf 中的单元格内制作表格?这是我所知道的最简单的表格: {\rtf\ansi\deff0 \trowd \intbl \cellx1000 Item 1\cell \cellx2000 I
我正在研究 RTF 解析器,但在处理 unicode 时遇到了一些困难。 RTF 规范规定“大于 32767 的 Unicode 值必须表示为负数”( http://www.biblioscape.c
我想更改 RTF 文档的内容,而不是将其另存为 RTF 文档: $defaultRtfFile>> "C:\Users\user\Desktop\Outlokk-Signature\Test.rtf"
我需要一个简单的 HTML2RTF 转换器我尝试运行以下代码...但我收到此代码示例的错误 代码: import java.io.ByteArrayInputStream; import java.i
我想编写一个 python 脚本,将文件编码从 cp949 转换为 utf8。该文件最初以 cp949 编码。我的脚本如下: cpstr = open('terms.rtf').read() utf
有哪些方法可以使用 Java 将 RTF 转换为包含 Windows 或 Unix 文档中表格的 PDF? 我们在这里尝试过的选项是: ITEXT - 但 rtf 文档中的表格在转换为 PDF 后无法
按照目前的情况,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the
似乎不可能为 RTF 项目符号列表找到一个非常简单的工作示例,如下所示: 您好 世界 嵌套(但请以正方形作为项目符号) 也嵌套(也是方形项目符号) 再次定期 我尝试使用 Word 或 TextEdit
我有一个数据框 df 用于 RTF 格式的报告,如下所示: df <- ATRSLBL POPUL CENTRE BAGE BAGEC1 SEX Red PPS 3720
我正在处理由其他人在未知平台上制作的 RTF 文件,并且所有内容都被正确解释,除了一些字符,无论我在 openoffice 中打开它们的任何字符集。这是经过解释的纯文本: "Même taille q
有人知道RTF文件的linter吗? 我正在为文字处理器编写一个简单的 RTF 导出工具。我已经到了我生成的文件现在加载到 OpenOffice 并且似乎可以工作的阶段——除了我刚刚发现如果我从 Op
有人可以帮我将特殊字符转换为可以在 RTF 文件中正确表示的字符吗? 我正在获取 iPad 上存储在字符串中的文本,并使用 NSASCIIStringEncoding 将其输出为 RTF 文件。到目前
我对 RichTextBox.Rtf 属性有点困惑。我正在输入一个混合字体大小的字符串:Test 字体大小为 20,string 字体大小为 10。但是,当我查看 Rtf 时 字符串,我得到以下内容:
我正试图让一个欧元符号显示在 RTF 文档中,但我不太走运。 RTF 文档是一个模板,其中填充了来自 .Net 的数据(通过读取文本流并替换其中的标记)。这些标记之一与欧元符号有关。我的代码按预期工作
我是一名优秀的程序员,十分优秀!