gpt4 book ai didi

elasticsearch - 如何使用Elasticsearch使目录中的文件可搜索?

转载 作者:行者123 更新时间:2023-12-02 22:57:17 25 4
gpt4 key购买 nike

我是搜索引擎和Elasticsearch的新手,所以如果这个问题听起来含糊,请多多包涵。我有一个很大的目录,其中包含许多.csv和.hdr文件,并且我希望能够在这些文件中搜索文本。我已经完成了教程并阅读了一些文档,但是我仍在努力理解索引的概念。似乎所有教程都向您展示了如何一次索引一个文档,但是由于我有很多文件,这将花费很长时间。有没有更简单的方法可以使elasticsearch索引此目录中的所有文档并能够搜索我想要的内容?

最佳答案

Elasticsearch只能搜索已建立索引的文档。建立索引意味着Elasticsearch一次消耗了一个文档并将其存储在内部。
通常,内部结构很重要,因此您了解自己在做什么以获取最佳性能。
因此,您需要一种使文件进入 flex 搜索的方法,我深信没有实现这种目标的“一键式”方法。
你需要

  • 运行群集
  • 为文件
  • 设计的索引
  • 将文件从文件系统获取到Elasticsearch

  • 您的问题集中在3)。
    为此,搜索脚本示例或可以爬网目录并为Elasticsearch提供文档的工具。
    5秒钟使用Google的经历
  • https://github.com/dadoonet/fscrawler
  • https://gist.github.com/stevehanson/7462063
  • 从理论上讲,可以使用Logstash(https://www.elastic.co/guide/en/logstash/current/plugins-inputs-file.html)完成,但我会尝试fscrawler。
  • 关于elasticsearch - 如何使用Elasticsearch使目录中的文件可搜索?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48065342/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com