gpt4 book ai didi

parsing - PDF 文本和坐标解析

转载 作者:行者123 更新时间:2023-12-02 08:57:35 25 4
gpt4 key购买 nike

我目前正在使用 PDF Box 来解析 pdf,我正在尝试找出如何检索有关文本的数据,例如字体(粗体、大小等)和字体的位置。

有什么建议吗?

最佳答案

在浏览(很难找到)PDFBox 文档后,我发现 this little gem .

显然,其中一个示例准确地展示了如何完成您要求的所有操作。基本上,您可以对 PdfTextStripper 进行子类化并重写 processTextPosition 方法。在那里,您查询 TextPosition获取您需要的任何信息。

为了将来引用,您可以在此处找到 javaDoc:http://pdfbox.apache.org/apidocs/index.html

编辑 2018-04-02:原始链接已失效,但示例可以在 SVN repo here 中找到.

关于parsing - PDF 文本和坐标解析,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6418673/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com