gpt4 book ai didi

java - 如何使用 Apache POI 读取 Java 中的 .DOC 文件以将图像与文本分开?

转载 作者:搜寻专家 更新时间:2023-10-31 08:18:37 26 4
gpt4 key购买 nike

我需要从 Java 读取一个包含文本和图像的 Word .doc 文件。我需要识别图像和文本并将它们分成 2 个文件。

我最近听说了“Apache POI”。如何使用 Apache POI 读取 Word .doc 文件?

最佳答案

apache网站上的例子和示例代码都不错。我建议您从这里开始。

http://poi.apache.org/hwpf/quick-guide.html

To get specific bits of text, first create a org.apache.poi.hwpf.HWPFDocument. Fetch the range with getRange(), then get paragraphs from that. You can then get text and other properties.

Here以提取图像为例。 Here截至撰写本文时的最新修订版。

当然,Javadocs

请注意,根据 POI 站点,

HWPF is still in early development.

关于java - 如何使用 Apache POI 读取 Java 中的 .DOC 文件以将图像与文本分开?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/597566/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com