- r - 以节省内存的方式增长 data.frame
- ruby-on-rails - ruby/ruby on rails 内存泄漏检测
- android - 无法解析导入android.support.v7.app
- UNIX 域套接字与共享内存(映射文件)
我编写了一个简单的 shell 脚本来查找大文件,主要是为了节省我自己的输入时间。这项工作正在完成:
find $dir -type f -size +"$size"M -printf '%s %p\n' | sort -rn
我想将字节输出转换为人类可读的格式。我在网上找到了如何手动执行此操作的方法,例如,
find $dir -type f -size +"$size"M -printf '%s %p\n' | sort -rn |
awk '{ hum[1024**4]="TB"; hum[1024**3]="GB"; hum[1024**2]="MB"; hum[1024]="KB"; hum[0]="B";
for (x=1024**4; x>=1024; x/=1024){
if ($1>=x) { printf "%7.2f %s\t%s\n",$1/x,hum[x],$2;break }
}}'
但这看起来很乱。我想知道:是否有一种标准方法可以将字节转换为人类可读的形式?
当然,也欢迎使用任何生成以下输出的替代方法,给定目录和最小大小作为输入:
1.25 GB /foo/barf
598.80 MB /foo/bar/bazf
500.58 MB /bar/bazf
421.70 MB /bar/baz/bamf
...
注意:这必须在 2.4 和 2.6 上都有效,并且输出应该排序。
最佳答案
使用du -h
和sort -h
find /your/dir -type f -size +5M -exec du -h '{}' + | sort -hr
解释:
du -h file1 file2 ...
以 human 可读格式打印 disk usage给定的文件。sort -hr
以r相反的顺序对 human 可读数字进行排序(首先是较大的数字)。 find -exec
的选项+
将减少命令du
的调用次数,从而加快执行速度。这里的+
可以替换成';'
。如果您希望在最后打印较大的文件,您可以删除 sort
命令的选项 -r
。您甚至可以使用更简单的以下命令,但您的终端窗口缓冲区可能已满!
find /your/dir -type f -exec du -h '{}' + | sort -h
或者如果您只想要前十个较大的文件:
find /your/dir -type f -exec du -h '{}' + | sort -hr | head
注意 sort
的选项 -h
大约在 2009 年引入,因此这个选项在旧发行版上可能不可用(因为红帽 5).此外,find -exec
的选项 +
在旧发行版(如 Red Hat 4)上也不可用。
在旧发行版上,您可以使用 xargs
代替 find -exec
的选项 +
。命令 ls
也可用于打印排序的文件。但要保证按大小排序,xargs
必须仅调用一次ls
。如果您的文件数量可以接受,xargs
只能调用一次 ls
:这取决于传递给 ls
参数的文本长度(所有文件名的总和长度)。
find /your/dir -type f -size +5M -print0 | xargs -0 ls -1Ssh
(从 MichaelKrelin-hacker 中借鉴了一点灵感)。
解释:
ls -1
每行显示一个文件ls -S
按文件大小排序ls -s
打印文件大小ls -h
以人类可读的格式打印尺寸最快的命令可能是使用上面的 ls -1Ssh
和 find -exec
的 +
选项,但与上面的文件数量一样必须可接受仅调用一次 ls
以保证按大小排序(find -exec
的选项 +
> 与 xargs
的工作方式大致相同。
find /your/dir -type f -size +5M -exec ls -1Ssh '{}' +
要减少找到的文件数量,您可以增加阈值大小:例如将 +5M
替换为 +100M
。
关于linux - 命令打印大文件,排序,大小为人类可读格式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8943154/
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题吗? Update the question所以它是on-topic用于堆栈溢出。 关闭 9 年前。 Improve this
我有一系列 SQL 命令,我想在大约 40 个不同的表上运行。必须有一种方法可以在不编写 40 条不同命令的情况下执行此操作... 我在 SQL Server 中运行它。所有表都有不同的名称,我要操作
我习惯在 PHP 中使用命令“mysql_insert_id()”来返回插入到我的数据库中的最后一行的 id。 在 C# 中的 SQLite 中是否有等效的命令? 谢谢! -阿德娜 最佳答案 选择 l
试图找出一种方法来回填 ds 分区 Hive 表的分区。 我知道如何从 CLI 运行 Hive 命令,例如 $HIVE_HOME/bin/hive -e 'select a.col from tab1
我有 .bat 文件。看起来像下一个 ....many commands1 ftp -i -s:copy.txt ...many commands2 copy.txt 包含下一个命令 open ...
基本上我想输入 show 并检查是否有 show 命令或别名已定义并触发它,如果未定义则触发 git show 。 例如 rm 应该执行 rm 但 checkout 应该执行 git checkout
我公司的主数据库是 iSeries 机器,我已经非常习惯使用 DB2 命令和结构。我现在正在尝试做一个小项目,更新一个包含超过 300 万条记录的表。我想出一种比较和“清理”数据的更快方法是使用 My
我想在带有 Node 的终端中制作一个简单的按钮板,并“blessed”用于连接或运行不同的命令。 ----------------------------------------------- _
我们有一个 selenium IDE 脚本,正在转换为 python webdriver。以下命令未转换: [openWindow | http://mywebsite.com/index.php |
我正在学习这个关于从 GIT HUB 下载和安装 Web 文件的在线教程。我进入主题:启动我们的静态网站,系统提示我输入命令以下载和安装 Web 文件。但是,当我输入命令 yarn install 时
我在 shell 脚本中使用 elif 命令时遇到问题,就像在 fortran 中一样。 我有 100 家公司的员工名单。我想屏蔽那些员工少于 500 人的公司。我的脚本是 rm -f categor
我有一些 Linux 命令可以生成 token 。我在 Linux 机器上使用操作系统库形式的 Python 自动化了这些命令。它工作正常。 但是,当我在 Windows 中尝试相同的代码时,它没有返
本文分享自华为云社区《Git你有可能不知道交互式暂存》,作者:龙哥手记。 本节中的几个交互式 Git 命令可以帮助你将文件的特定部分组合成提交。 当你在修改了大量文件后,希望这些改动能拆分为若干提交而
我想知道如何使用 IN 比较语法来做到这一点。 当前的 SQL 查询是: select * from employee where (employeeName = 'AJAY' and month(e
我在这个位置安装了 Hadoop /usr/local/hadoop$ 现在我想列出 dfs 中的文件。我使用的命令是: hduser@ubuntu:/usr/local/hadoop$ bin/ha
是否有一个单一的 docker 命令可用于清除所有内容?如果正在运行,请停止所有容器、删除所有图像、删除所有卷...等。 最佳答案 我认为没有一个命令可以做到这一点。您首先需要停止所有容器使用 $ d
我基本上是在 clojure/nrepl 模式中寻找与 C-u C-x C-e 或 C-c C-p 等效的 Scheme。 我想要一个 C-x C-e 将输出打印到缓冲区,而不是仅仅在 repl 中。
我可以在 vim 中使用 pudb(一个 ncurses Python 调试器),因为,例如,:!python %在实际的终端窗口中运行。我更喜欢使用 gvim,但 gvim 运行 :!python
我正在尝试编写一个 FFMPEG 命令: 取为 输入 一个视频 input.mp4 和一个图像 pic.jpg 作为 输出 将 input.mp4 拆分为 20 秒的视频,按顺序重命名;对于每个分割视
我想转储视频每帧的比特率。我正在尝试使用 -vstats 获取此信息命令。当我运行此命令时 - ffmpeg -i input.mp4 -vstats 它显示至少应该定义一个文件。 如果有人能建议我任
我是一名优秀的程序员,十分优秀!