gpt4 book ai didi

java - 使用 PDFBox 保护 PDF

转载 作者:塔克拉玛干 更新时间:2023-11-03 05:02:58 24 4
gpt4 key购买 nike

我真的为 PDFBox 的文档而苦恼。对于这样一个受欢迎的图书馆,信息似乎有点单薄(对我来说!)。

无论如何,我遇到的问题与保护 PDF 有关。目前我只想控制用户的访问权限。具体来说,我想阻止用户修改 PDF。

如果我省略访问权限代码,一切都会完美无缺。我正在阅读来自外部资源的 PDF。然后我阅读并填充字段,在保存新 PDF 之前添加一些图像。一切都很完美。

当我添加以下代码来管理访问时,问题就来了:

/* Secure the PDF so that it cannot be edited */
try {
String ownerPassword = "DSTE$gewRges43";
String userPassword = "";

AccessPermission ap = new AccessPermission();
ap.setCanModify(false);

StandardProtectionPolicy spp = new StandardProtectionPolicy(ownerPassword, userPassword, ap);
pdf.protect(spp);
} catch (BadSecurityHandlerException ex) {
Logger.getLogger(PDFManager.class.getName()).log(Level.SEVERE, null, ex);
}

当我添加此代码时,所有文本和图像都从传出的 pdf 中剥离出来。这些字段仍然存在于文档中,但它们都是空的,原始 PDF 的一部分和在代码中动态添加的所有文本和图像都消失了。

更新:好的,据我所知,问题出在与表单字段相关的错误中。我将尝试一种没有表单字段的不同方法,看看它能提供什么。

最佳答案

我找到了这个问题的解决方案。看起来,如果 PDF 来自外部来源,有时 PDF 会受到保护或加密。

如果您在从外部源加载 PDF 文档并添加保护时得到空白输出,您可能正在使用加密文档。我有一个处理 PDF 文档的流处理系统。所以下面的代码对我有用。如果您只是使用 PDF 输入,那么您可以将以下代码集成到您的流程中。

public InputStream convertDocument(InputStream dataStream) throws Exception {
// just acts as a pass through since already in pdf format
PipedOutputStream os = new PipedOutputStream();
PipedInputStream is = new PipedInputStream(os);

System.setProperty("org.apache.pdfbox.baseParser.pushBackSize", "2024768"); //for large files

PDDocument doc = PDDocument.load(dataStream, true);

if (doc.isEncrypted()) { //remove the security before adding protections
doc.decrypt("");
doc.setAllSecurityToBeRemoved(true);
}
doc.save(os);
doc.close();
dataStream.close();
os.close();
return is;
}

现在获取返回的 InputStream 并将其用于您的安全应用程序;

   PipedOutputStream os = new PipedOutputStream();
PipedInputStream is = new PipedInputStream(os);

System.setProperty("org.apache.pdfbox.baseParser.pushBackSize", "2024768");
InputStream dataStream = secureData.data();

PDDocument doc = PDDocument.load(dataStream, true);
AccessPermission ap = new AccessPermission();
//add what ever perms you need blah blah...
ap.setCanModify(false);
ap.setCanExtractContent(false);
ap.setCanPrint(false);
ap.setCanPrintDegraded(false);
ap.setReadOnly();

StandardProtectionPolicy spp = new StandardProtectionPolicy(UUID.randomUUID().toString(), "", ap);

doc.protect(spp);

doc.save(os);
doc.close();
dataStream.close();
os.close();

现在这应该返回一个没有空白输出的正确文档!

诀窍是先删除加密!

关于java - 使用 PDFBox 保护 PDF,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13067437/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com