gpt4 book ai didi

java - 如何使用 Apache Tika 从 .wps 文件中提取文本?

转载 作者:行者123 更新时间:2023-12-01 11:07:00 26 4
gpt4 key购买 nike

我正在使用 Tika 从多种类型的文档中提取文本。java -jar tika-app-1.10.jar -T [输入文件]我意识到 Tika-1.10 可以检测 .wps 文件(java -jar tika-app-1.10.jar -m [.wps] 正在返回元数据),但它无法从 .wps 文件中提取文本(java - jar tika-app-1.10.jar -T [.wps] 文件不返回任何内容)。有没有其他方法可以从Java中的wps文件中提取文本?任何帮助是极大的赞赏谢谢

最佳答案

从 Tika 1.13 开始,我们没有 wps 文件的解析器。我们确实支持旧的 Works 7.0 电子表格,但不支持 wps。请在我们的 JIRA 上打开问题如果您希望我们增加支持。 (坦白说,我不知道这需要做多少工作)。

关于java - 如何使用 Apache Tika 从 .wps 文件中提取文本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32845197/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com