gpt4 book ai didi

java - 如何使用 apache poi 从 ppt、pptx 文件中提取除页脚、幻灯片编号之外的文本?

转载 作者:行者123 更新时间:2023-11-29 09:32:26 26 4
gpt4 key购买 nike

我知道如何像这样使用 apache poi 从 ppt 文件中提取文本

        InputStream fis=new FileInputStream("abcd.ppt");
HSLFSlideShow show=new HSLFSlideShow(fis);
SlideShow ss=new SlideShow(show);
Slide[] slides=ss.getSlides();
StringBuilder builder = new StringBuilder();
for(int x=0; x < slides.length; x++)
{
TextRun[] runs = slides[x].getTextRuns();
for(int j=0; j<runs.length; j++) {
TextRun run = runs[j];
if(run != null) {
String text = run.getText();
builder.append(text);
}
}
}

但它会提取我不想要的所有页脚和幻灯片编号

那么如何提取除页脚和幻灯片编号之外的文本

提前致谢

最佳答案

我建议您查看 JPresentation。他们的一个示例展示了如何从所有幻灯片中提取所有图像和文本:http://www.independentsoft.de/jpresentation/tutorial/exportallslides.html

API 接缝非常容易。

关于java - 如何使用 apache poi 从 ppt、pptx 文件中提取除页脚、幻灯片编号之外的文本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15528488/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com