gpt4 book ai didi

java - 提取 PDF 中的表数

转载 作者:行者123 更新时间:2023-11-30 09:21:32 25 4
gpt4 key购买 nike

最佳答案

如果您的 PDF 被标记,您可以检查表结构的 StructTreeRoot。如果您的 PDF 没有标记,则您的 PDF 中没有表格。您可能用肉眼看到表格,但就 PDF 文件而言,只有行和文本片段,没有表格!

未标记的 PDF 对其结构一无所知!从不包含 StructTreeRoot 的 PDF 中提取表格就像从胡萝卜汤中提取完整的胡萝卜一样可行。如果那是您想要做的,那么希望我的比喻能解释为什么您要求的东西是不可能的(这也解释了为什么您找不到任何答案)。

如何确定 PDF 是否已加标签?在 Adob​​e Reader 中打开 PDF,然后单击文件 > 文档属性。在“属性”选项卡底部的某处,有一个条目指示标记的 PDF:否标记的 PDF:是

关于java - 提取 PDF 中的表数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16937442/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com