gpt4 book ai didi

database - 如何高效存储数十万文档?

转载 作者:搜寻专家 更新时间:2023-10-30 19:40:49 25 4
gpt4 key购买 nike

我正在开发一个需要存储大量文档(PDF、Word 文件等)的系统。我正在使用 Solr/Lucene 来搜索从这些文档中提取的相关信息,但我还需要一个地方来存储存储原始文件,以便用户可以打开/下载它们。

我在想几种可能:

  • 文件系统 - 可能不是存储 100 万文档的好主意
  • sql 数据库 - 但我不需要它的大部分关系功能,因为我只需要存储二进制文档及其 ID,所以这可能不是最快的解决方案
  • 非 sql 数据库 - 对它们没有任何经验,所以我也不确定它们是否好用,它们也有很多,所以我不知道该选择哪个

我正在寻找的存储应该是:

  • 可扩展
  • 开源(不重要但很高兴)

您能否推荐您认为存储这些文件的最佳方式是什么?

最佳答案

文件系统——顾名思义——被设计和优化为以高效和可扩展的方式存储大量文件。

关于database - 如何高效存储数十万文档?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3967326/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com