gpt4 book ai didi

java - PDFBox、BBox、页码?

转载 作者:太空宇宙 更新时间:2023-11-04 08:04:17 28 4
gpt4 key购买 nike

我正在使用 PDFBox,成功地从 PDF 中检索字段坐标。继续处理多页 PDF,我遇到了这样的情况:我需要确定这些字段来自哪个页面,此外还需要将坐标从自下而上转换为自上而下。我已经阅读了文档的许多页面来找到可行的方法,大多数返回 null 或失败,并且搜索时没有结果。

我在寻找什么?文档大纲? BBbos?媒体盒?裁剪框?

对于页码,其他一些库具有简单标题的方法,例如 getCurrentPageNo()。我需要:

List allPages = document.getDocumentCatalog().getAllPages();
for (int i = 0; i < allPages.size(); i++) {
// etc for each one?
}

这是一个如此核心的能力,我有点惊讶我还没有找到例子。

最佳答案

明白了:

PDPage page = .........
PDRectangle mediaBox = page.getMediaBox();
System.out.println( "Width:" + mediaBox.getWidth() );
System.out.println( "Height:" + mediaBox.getHeight() )

页码:

page.getCOSDictionary().equals(page))

关于java - PDFBox、BBox、页码?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12323814/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com