gpt4 book ai didi

java - 如何获取带标签的pdf中标签的页码

转载 作者:行者123 更新时间:2023-12-01 18:15:51 25 4
gpt4 key购买 nike

我想获取带标签的 PDF 中标签的页码。

我尝试过下面的代码,但我不确定。

for(Object coDic: structElement.getKids()) {
int page=((PDStructureElement) coDic).getCOSObject().getCOSDictionary(COSName.PG).getInt(COSName.STRUCT_PARENTS);
}

最佳答案

structParents 是完全不同的东西(参见 PDF specification )。这样做:

PDPage page = new PDPage(((PDStructureElement) coDic).getCOSObject().getCOSDictionary(COSName.PG));
int pageNum = doc.getPages().indexOf(page);

或更好:

PDPage page = ((PDStructureElement) coDic).getPage();
int pageNum = doc.getPages().indexOf(page);

(省略空检查和类检查)

关于java - 如何获取带标签的pdf中标签的页码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60371287/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com