gpt4 book ai didi

java - 用于将现有PDF转换为PDF/A的免费Java库

转载 作者:太空狗 更新时间:2023-10-29 22:54:09 24 4
gpt4 key购买 nike

我正在尝试将PDF转换为PDF/A。
目前,我可以使用OpenOffice pdf viewer pluginJodconverter 2一起执行此操作。但这样做很麻烦。
有人知道我可以用什么开源/免费Java库来做这个吗?
到目前为止,我已经找到了这些开放源码库,但没有一个库支持将PDF转换为PDF/A。
iText
gnujpdf
PDF Box
FOP
JFreeReport
PJX
JPedal
PDFjet
jPod
PDF Renderer
更新
似乎Apache FOP能够将文档(而不是pdf文档)转换为pdf/a

最佳答案

从PDF转换为PDF/A
这是对你的问题的最初的回答。
对于不涉及潜在有损重新渲染的解决方案,请查看http://www.opensubscriber.com/message/itext-questions@lists.sourceforge.net/8027900.html,Foris Zoltan似乎能够在不过度终止重新渲染的情况下使用IText(不是详尽的,但对于大多数PDF可能足够)。
如果根据您的要求,佐尔坦的解决方案不可接受/不充分,那么您将不得不重新渲染。您可以继续使用OpenOffice/JodConverter,或者通过最好使用ghostscript(它们的母亲),通过管道将pdf2ps送回PDF/A-enabled ps2pdf来降低开销。
阿帕奇FOP
其他受访者建议使用ApacheFop,在PDF到PDF/A转换的背景下,它有以下优点和缺点:
优势:与OpenOffice/JodConverter组合相比,“移动部件”更少(例如,将进程内FOP与后台监控OO进行比较)
缺点:您负责将PDF转换为XSL-FO或以其他方式呈现为FOP(您需要更多的编码和/或集成工作),而OpenOffice/JodConverter和Ghostscript可能需要较少的额外编码。
但是,如果我没有弄错的话,您似乎正在使用PDF作为中间格式,也就是说,您试图实现的是XHTML到PDF/A的转换。通过将XHTML直接转换为PDF/A,该过程将更快,将使用更少的资源(例如内存),并且不会不必要地降低输出质量(如重新渲染解决方案所能),也不会需要对PDF格式的深入了解(如Zoltan的解决方案所做)。
在这种情况下,直接从XHTML转换为PDF/A将是一个理想的解决方案,无论是using iText directly(示例使用ITExtPurt,ItEXT的.NET端口,但对于Java是相同的),或者使用Apache FoP,正如其他人所建议的那样(当输出到PDF时,它也在内部使用ITEXT),尽管它是与直接使用IText相比,它可能会产生比IText示例更好的结果,因为它比直接使用IText更膨胀、效率更低、安装更复杂——只有一种方法可以解决这一问题,即您必须在一些XHTML文件上作为示例进行尝试。:)

关于java - 用于将现有PDF转换为PDF/A的免费Java库,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2461852/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com