gpt4 book ai didi

perl - 如何使用 Perl 对平面文件进行全文搜索?

转载 作者:行者123 更新时间:2023-12-01 07:23:02 24 4
gpt4 key购买 nike

我们有一个基于 Perl 的 Web 应用程序,它的数据来自一个庞大的纯文本文件存储库。这些平面文件被放置在我们系统的一个目录中,我们广泛地解析它们,将一些信息插入到 MySQL 数据库中,然后将这些文件移动到它们的存档存储库和永久主页 (/www/website/archive/*.txt)。现在,我们不会解析这些平面文件中的每一位数据,并且一些更晦涩的数据项不会被数据库化。

当前的要求是用户能够从 Perl 生成的网页对整个平面文件存储库执行全文搜索,并带回点击列表,然后他们可以单击并打开文本文件审查。

启用此搜索功能的最优雅、最高效且非 CPU 密集型的方法是什么?

最佳答案

我建议,按这个顺序:

  • 将每个文档的全部内容放入 MySQL 表中,并使用 MySQL 的全文搜索和索引功能。我从来没有这样做过,但 MySQL 总是能够处理比我能投入的更多的东西。
  • Swish-E 仍然存在,旨在构建全文索引并允许排名结果。我已经运行它几年了,它运行得很好。
  • 您可以使用 File::Find在你的 Perl 代码中咀嚼像 grep -r 这样的存储库,但与上面的索引选项之一相比,它会很糟糕。但是,它会起作用,甚至可能会让您感到惊讶:)
  • 关于perl - 如何使用 Perl 对平面文件进行全文搜索?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/591918/

    24 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com