gpt4 book ai didi

java - PDFBox convertToImage 无法正确呈现某些 PDF

转载 作者:行者123 更新时间:2023-11-29 08:54:46 24 4
gpt4 key购买 nike

我正在使用 PDFBox 的 PDPage.convertToImage() 方法将加载的 PDF 文件的页面转换为图像。它对某些 PDF 工作正常,但它会向控制台显示大量文件的错误,这些文件无法在屏幕上正确呈现 - 图像和文本丢失。

Dec 31, 2013 7:15:34 PM org.apache.pdfbox.util.PDFStreamEngine processOperator
INFO: unsupported/disabled operation: EI
Dec 31, 2013 7:15:34 PM org.apache.pdfbox.pdmodel.font.PDTrueTypeFont getawtFont
INFO: Using font SansSerif.plain instead

Dec 31, 2013 7:02:15 PM org.apache.pdfbox.util.PDFStreamEngine processOperator
INFO: unsupported/disabled operation: i

文件加载只需使用:

PDDocument pdfDoc = PDDocument.load(file);
List<PDPage> pages = pdfDoc.getContent().getDocumentCatalog().getAllPages();
PDPage page = pages.get(pageNo);
page.convertToImage();

我尝试使用 loadNonSeq() 而不是 load() 但这没有帮助。我应该对 PDFStreamEngine 做些什么来让它处理这些 PDF 文件吗?我不确定读者是否真的无法呈现这些内容,或者功能是否需要以某种方式启用。

最佳答案

你的问题在我之前回答的帖子中解决了,通过使用 PDFRender jar 是可能的。

How to increase the resolution of image in PDF renderer? .

发布的问题仅转换 PDF 的第一页,答案将 PDF 的所有页面转换为图像格式。

关于java - PDFBox convertToImage 无法正确呈现某些 PDF,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20862335/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com