gpt4 book ai didi

java - 如何在java中检测文档的确切类型

转载 作者:塔克拉玛干 更新时间:2023-11-02 08:25:32 25 4
gpt4 key购买 nike

如何在 java 中检测文档的确切类型。实际上,我会在运行时获得很多文档,如文章、手册和指南等,我需要使用 java 来识别它们的实际类型。文档可以是 PDF、HTML、DOC、XML 等。我什至没有文档的扩展名。看,我将从 db 获取文档。如果只有 PDF,我将有扩展名,但如果是 HTML 和其他文件,我将没有扩展名。其实只要拿到内容我就得判断是哪一种内容,然后我会实现我的业务逻辑...请帮助我。

最佳答案

Apache Tika 具有检测 MIME 类型文件的工具:

http://tika.apache.org/

但是,它非常重量级,因为它所做的不仅仅是 MIME 类型检测。

关于java - 如何在java中检测文档的确切类型,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6525142/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com