gpt4 book ai didi

apache-poi - 如何使用 POI 以粗体和斜体格式阅读 Word 文档

转载 作者:行者123 更新时间:2023-12-03 16:35:54 30 4
gpt4 key购买 nike

我正在使用 Apache POI。

我可以使用“org.apache.poi.hwpf.extractor.WordExtractor”从文档文件中读取文本

甚至使用“org.apache.poi.hwpf.usermodel.Table”获取表格

但请建议我,我怎样才能获取文本的粗体/斜体格式。

提前致谢。

最佳答案

WordExtractor只返回文本,没有别的。

获取word文档文本+格式的最简单方法是切换到使用Apache Tika . Apache Tika 构建在 Apache POI(等等)之上,并提供纯文本提取和丰富的提取(带格式的 XHTML)。

或者,如果您想自己编写代码,我建议您查看 Tika's WordExtractor 中的代码。 ,它演示了如何使用 Apache POI 获取文本运行的格式信息。

关于apache-poi - 如何使用 POI 以粗体和斜体格式阅读 Word 文档,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16937790/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com