gpt4 book ai didi

Java PDFBox,从表的列中提取数据

转载 作者:行者123 更新时间:2023-12-01 14:38:40 24 4
gpt4 key购买 nike

我想知道如何从此pdf中提取(例如图像)http://postimg.org/image/ypebht5dx/

例如,我只想提取“TENSIONE[V]”列中的值,如果遇到空白单元格,我在输出中输入字母“X”。我该怎么办?

我使用的代码是这样的:

 PDDocument p=PDDocument.load(new File("a.pdf"));
PDFTextStripper t=new PDFTextStripper();
System.out.println(t.getText(p));

我得到这个输出:

http://s23.postimg.org/wbhcrw03v/Immagine.png

最佳答案

这些只是指导方针。使用时使用它们。这也没有经过测试,但可以帮助您解决问题。如果您有任何疑问,请告诉我。

String text = t.getText(p);
String lines[] = text.split("\\r?\\n"); // give you all the lines separated by new line

String cols[] = lines[0].split("\\s+") // gives array separated by whitespaces
// cols[0] contains pins
// clos[1] contains TENSIONE[V]
// cols[2] contains TOLLRENZA if not present then its empty

关于Java PDFBox,从表的列中提取数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16217999/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com