gpt4 book ai didi

java - Spring Boot 中的 Tika 解析器配置

转载 作者:行者123 更新时间:2023-12-02 01:10:08 28 4
gpt4 key购买 nike

我在我的项目中使用 tika 解析器。我正在使用此包中的三个类:

org.apache.tika.Tika;
org.apache.tika.parser.txt.CharsetDetector;
org.apache.tika.parser.txt.CharsetMatch;

上次我把版本从Tika 1.0升级到Tika 1.20。然后它开始抛出警告,例如:

WARN  org.apache.tika.parser.SQLite3Parser : org.xerial's sqlite-jdbc is not loaded.
Please provide the jar on your classpath to parse sqlite files.
See tika-parsers/pom.xml for the correct version.

我的应用程序中不需要这些依赖项,因此我尝试通过以下方式避免它:0.创建tika-config.xml文件

<?xml version="1.0" encoding="UTF-8"?>
<properties>
<service-loader initializableProblemHandler="ignore"/>
</properties>
  1. 添加到 application.yaml tika.config 属性,其中包含 tika-config.xml 文件的相对和非相对路径。没有成功。
  2. 添加了 TIKA_CONFIG 环境变量。也没起作用。

还有其他解决方案可以尝试消除这些警告吗?

最佳答案

您收到此警告的原因是因为 sqlite 不再嵌入 tika jar https://cwiki.apache.org/confluence/display/tika/SQLite%20Parser

尝试用此排除 sql,或添加 sqlite 依赖项

<?xml version="1.0" encoding="UTF-8"?>
<properties>
<parsers>
<parser class="org.apache.tika.parser.DefaultParser">
<mime-exclude>application/sql</mime-exclude>
</parser>
</parsers>
</properties>

如果你想添加sqlite依赖

将其添加到您的 pom.xml

<dependency>
<groupId>org.xerial</groupId>
<artifactId>sqlite-jdbc</artifactId>
<version>3.8.10.1</version>
</dependency>

关于java - Spring Boot 中的 Tika 解析器配置,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59529806/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com