gpt4 book ai didi

java - 从 PDFBox 1.x 迁移到 PDFBox 2

转载 作者:行者123 更新时间:2023-12-02 04:09:06 32 4
gpt4 key购买 nike

我一直在使用 PDFBox 1.8 来处理 pdf。现在我计划转向 PDFBox 2.0-RC-2。我在迁移时遇到一些问题。

在 PDFBox 1.8 中,我曾经使用以下方法从 PDPage 获取 token :

PDStream contents = page.getContents();
PDFStreamParser parser = new PDFStreamParser(contents.getStream());
parser.parse();
List<Object> tokens = parser.getTokens();

但是,page.getContents() 在 PDFBox 2 中返回一个 InputStream。如何获取 PDStream?我应该使用 page.getContentStreams() (返回 Iterable)并迭代它吗?此外,构造函数 new PDFStreamParser(COSStream) 似乎已被弃用。

我遇到的另一个问题是图像替换。我使用 replaceWithStream

将一张图像替换为另一张图像
PDResources resources = page.getResources();
Iterable<COSName> xObjectNames = resources.getXObjectNames();
if (null != xObjectNames) {
for(COSName xObjectName : xObjectNames){
PDXObject object = resources.getXObject(xObjectName);
if (object instanceof PDImageXObject) {
PDImageXObject img1 = (PDImageXObject) object;
PDImageXObject img2 = ....
img1.getCOSStream().replaceWithStream(
img2.getCOSStream());
}
}
}

replaceWithStream 方法在 PDFBox 1.8 中已被弃用,因此在 PDFBox 2.0 中,它已被完全删除。用 img2 替换 img1 的其他方法是什么?

最佳答案

回答问题的第一部分:

PDFStreamParser parser = new PDFStreamParser(page);
parser.parse();
List<Object> pageTokens = parser.getTokens();

回答问题的第二部分:

如果两个图像具有相同的滤镜、大小等,应该是这样的:

OutputStream os = img1.getCOSStream().createRawOutputStream();
InputStream is = img2.getCOSStream().createRawInputStream();
IOUtils.copy(is, os);
is.close();
os.close();

更新:如果它们不相同,也请执行以下操作:

COSStream c1 = img1.getCOSStream();
COSStream c2 = img2.getCOSStream();
for (COSName name : c1.keySet())
{
c1.setItem(name, null);
}
for (COSName name : c2.keySet())
{
c1.setItem(name, c2.getItem(name));
}

关于java - 从 PDFBox 1.x 迁移到 PDFBox 2,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33966754/

32 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com