gpt4 book ai didi

java - Apache tika 错误地检测 csv 的 mime 类型

转载 作者:太空宇宙 更新时间:2023-11-04 11:00:29 25 4
gpt4 key购买 nike

我使用 Excel 创建了 .csv 文件,并使用 apache tika 编写了以下代码:

public static boolean checkThatMimeTypeIsCsv(InputStream inputStream) throws IOException {
BufferedInputStream bis = new BufferedInputStream(inputStream);
AutoDetectParser parser = new AutoDetectParser();
Detector detector = parser.getDetector();
Metadata md = new Metadata();
MediaType mediaType = detector.detect(bis, md);
return "text/csv".equals(mediaType.toString());
}

public static void main(String[] args) throws IOException {
System.out.println(checkThatMimeTypeIsCsv(new FileInputStream("Data.csv")));
}

但它返回false'。

蒂卡太糟糕了还是我错过了什么?

最佳答案

试试这个...

public static String checkThatMimeTypeIsCsv(String fileName ) throws Exception {
File sourceFile = new File(fileName );
DefaultDetector file_detector = new DefaultDetector();
TikaInputStream file_stream = TikaInputStream.get(sourceFile);
Metadata metadata = new Metadata();
metadata.set(Metadata.RESOURCE_NAME_KEY, sourceFile.getName());
MediaType mediaType = file_detector.detect(file_stream, metadata);
String file_type = mediaType.toString();
System.out.println(file_type);
return file_type;
}

关于java - Apache tika 错误地检测 csv 的 mime 类型,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46960231/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com