gpt4 book ai didi

java - 如何使 PDFTextStripper V2.0.* 向后兼容 V1.8.*

转载 作者:太空宇宙 更新时间:2023-11-04 10:48:53 24 4
gpt4 key购买 nike

我将 pdfbox 从 1.8 升级到 2.0,但是我们发现从同一个 paf 文件中提取的文本有一些差异,但是我们严重依赖于 1.8 版本提取的格式化文本,我可以知道如何使 PDFTextStripper V2.0 与 PDFTextStripper V1.8 兼容吗?

V1.8中提取的文本

(Internal List)
Europe GmbH
Shipment Number: 6000047226 6000047226
Carrier: 7000001095 Loading start date: 24.07.2017 00:00:00

V2.0中提取的文本

(Internal List) Europe GmbH
Shipment Number: 6000047226 6000047226Carrier: 7000001095 Loading start date: 24.07.2017 00:00:00

最佳答案

感谢 Timan Hausherr 和 mkl 的回答。

我根据 PdfBox V2.0 提取的新格式内容更改了我的代码。

关于java - 如何使 PDFTextStripper V2.0.* 向后兼容 V1.8.*,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48060156/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com