gpt4 book ai didi

java - 从 Java 中的 PDF 文件解析字体大小

转载 作者:塔克拉玛干 更新时间:2023-11-02 20:11:31 24 4
gpt4 key购买 nike

我需要编写一个程序来找到 PDF 文档中最大的文本(可能是标题!),我试过使用 Tika作为解析器,但我找不到获取字体大小的方法。此外,Tika 库对于我的使用来说似乎过于强大和复杂。我可以使用更简单的方法/库吗?不使用库并自己解析 PDF 是否更容易或更好(我对这种方法有点感兴趣)?如果是这样,我应该从哪里开始?

非常感谢任何信息。

最佳答案

我找到了 this SO 上的方法覆盖 PDFBox 库中 PDFTextStripperprocessTextPosition 并提取字体大小。我之前没有看到它,因为帖子的问题有点不同。

关于java - 从 Java 中的 PDF 文件解析字体大小,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13070551/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com