gpt4 book ai didi

database - 统计Linux服务器上的文件夹和文件结构

转载 作者:太空宇宙 更新时间:2023-11-04 04:10:04 25 4
gpt4 key购买 nike

我需要为存储在 Linux 网络共享上的文件生成统计信息,并且希望能够在网络共享上本地运行 shell 脚本或程序以生成具有以下属性的数据点:

路径(或相对路径)|文件名 |文件大小 |创建日期 |日期已更改 |访问日期

大约有 1-200 万个文件 (8TB),我想探索该数据集,以了解文件类型(由文件名和路径的组合确定)相对于文件总数和存储总量的组织和平衡。

问题:

  1. 遍历文件系统并获取此数据的有效方法是什么?

  2. 您建议使用哪种数据库来探索此类数据以及层次结构中不同级别的统计信息?

最佳答案

这就是我最终用来解决问题的方法:

  1. 使用 Linux 命令 findfstat 将数据集生成为纯文本文件。
  2. Python 的 pandasexifread 库用于丰富和分析数据集。

关于database - 统计Linux服务器上的文件夹和文件结构,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19593562/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com