gpt4 book ai didi

java - 使用 Java 阅读 MS Word 2007

转载 作者:塔克拉玛干 更新时间:2023-11-02 08:26:23 24 4
gpt4 key购买 nike

我正在尝试通过 Java 读取 Microsoft word 文件。我已将 Apache poi-3.8-beta1 中的所有 .jar 文件包含到我的类路径中。但是,当我尝试运行它时,出现以下异常:

org.apache.poi.poifs.filesystem.OfficeXmlFileException: The supplied data appears to be in the Office 2007+ XML. You are calling the part of POI that deals with OLE2 Office Documents. You need to call a different part of POI to process this data (eg XSSF instead of HSSF)
at org.apache.poi.poifs.storage.HeaderBlock.<init>(HeaderBlock.java:131)
at org.apache.poi.poifs.storage.HeaderBlock.<init>(HeaderBlock.java:104)
at org.apache.poi.poifs.filesystem.POIFSFileSystem.<init>(POIFSFileSystem.java:138)
at readingmsword07.Main.main(Main.java:27)

以下是我的代码:

import org.apache.poi.xwpf.extractor.XWPFWordExtractor;
import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStream;
import java.io.*;
import org.apache.poi.poifs.filesystem.POIFSFileSystem;
import org.apache.poi.xwpf.usermodel.XWPFDocument;


public class Main {


public static void main(String[] args) {
try {
FileInputStream fis = new FileInputStream("C:\\TrialDoc.docx");
POIFSFileSystem fileSystem = new POIFSFileSystem(fis);
org.apache.poi.xwpf.extractor.XWPFWordExtractor oleTextExtractor =
new XWPFWordExtractor(new XWPFDocument(fis));
System.out.print(oleTextExtractor.getText());
} catch (Exception e) {
e.printStackTrace();
}
}

}

我正在使用 XWPFWordExtractor,因为我正在尝试阅读 2007 年的 word 文档,但出于某种原因,我无法找出处理此问题的正确 POI。

非常感谢任何帮助。提前致谢!

~ 伍兹

最佳答案

删除行,

POIFSFileSystem fileSystem = new POIFSFileSystem(fis);

关于java - 使用 Java 阅读 MS Word 2007,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5332813/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com