gpt4 book ai didi

lucene - Apache Tika 与 Apache Lucene

转载 作者:行者123 更新时间:2023-12-02 06:34:49 25 4
gpt4 key购买 nike

我有一个关于分析文档的问题。使用 Apache Tika,可以获取不同类型的不同文件的内容和元数据。

是否也可以使用 Tika 获取文件的关键字(即词干提取),还是我仍然需要 Lucene?

最佳答案

我不知道是否可能,但我建议在 lucene 中进行所有关键字分析。我个人的原因:

  • Tika 的主要目标是从文件中提取信息
  • Lucenes 定义了数据的分析和索引方式。数据分析方式对 lucene 索引在搜索中的表现有很大影响(查找您期望找到的内容)
  • 这是一种关注点分离,Tika 仅提取内容,Lucene 关心搜索相关内容

关于lucene - Apache Tika 与 Apache Lucene,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46663185/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com