gpt4 book ai didi

java - Apache Tika 中的 CSV 检测器

转载 作者:行者123 更新时间:2023-11-29 03:06:04 28 4
gpt4 key购买 nike

我正在使用 Apache 的 Java 库 Tika(tika-core 版本。1.10)。

是否存在用于 CSV 文件的 org.apache.tika.detect.Detector?MIME 类型应该是 text/csv,但我找不到类似的东西。

我想使用漂亮的detect 方法

最佳答案

当前 (v1.10) tika-mimetypes.xml 定义 text/csv 如下:

<mime-type type="text/csv">
<glob pattern="*.csv"/>
<sub-class-of type="text/plain"/>
</mime-type>

这意味着 Apache Tika 仅通过文件名进行检测。如果您使用 Tika#detect(File),Tika 会将文件名(在 Metadata.RESOURCE_NAME_KEY 键下)添加到传递给检测器的 Metadata 对象。 URL 也有类似的行为。

如果你想注入(inject)文件名,你可以使用类似的东西:

new Tika().detect(is, fileName)

如果您想根据内容进行一些启发,请随时在 Tika's JIRA 中查看并提交工单。 .

关于java - Apache Tika 中的 CSV 检测器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32137068/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com