gpt4 book ai didi

linux - 在 linux 中,如何仅按文件名比较两个目录并获取不匹配的结果列表

转载 作者:太空狗 更新时间:2023-10-29 11:29:16 25 4
gpt4 key购买 nike

我想知道如何仅通过文件名(忽略扩展名)来比较两个目录(不是递归地)以获得差异。例如,如果我有列表 A 和 B,我想知道 A 中有什么,B 中没有。

我目前正在处理一些图像。在一个目录中,我有扩展名为 .tiff 的源文件,在另一个目录中,我已经处理了扩展名为 .png 的文件。两个目录中的文件名相同,只是扩展名不同(例如,一个文件在目录 A 中名为 foo.tiff,在目录 B 中名为 foo.png)。

我正在尝试查找尚未处理的文件。

谢谢!

最佳答案

首先让我们创建一个辅助函数:

getfiles() { find "$1" -maxdepth 1 -type f -exec bash -c 'for f in "$@"; do basename "${f%.*}"; done' "" {} + | sort; }

如果你运行 getfiles dirname , 它将返回该目录中的文件的排序列表,没有目录名称,也没有任何扩展名。 -maxdepth 1选项意味着 find不会递归搜索。

现在,让我们比较文件目录AB :

diff <(getfiles A) <(getfiles B)

输出是通常的diff格式。由于可以使用 diff 的任何常规选项,因此输出格式非常灵活。

例子

这是一个示例目录 AB , 每个都有一个文件,另一个没有:

$ ls */
A/:
bar.png foo.png qux.png

B/:
bar.tiff baz.tiff foo.tiff

输出:

$ diff <(getfiles A) <(getfiles B)
1a2
> baz
3d3
< qux

输出正确识别 (a) B有一个 baz A 中不存在的文件和 (b) A有一个 qux B 中不存在的文件.

替代输出

假设我们只想做一个单方面的比较,找到B里面有哪些文件也不在 A 中.在这种情况下,grep可以使用:

$ grep -vxFf <(getfiles A) <(getfiles B)
baz

这里使用的选项是:

  • -v告诉grep排除匹配行

  • -x告诉grep只匹配整行

  • -F告诉grep模式是固定字符串,而不是正则表达式。

  • -f告诉grep从文件或类似文件的对象中获取模式列表 <(getfiles A) .

包含空格的文件和目录名称示例

考虑这些文件:

$ ls */
A A/:
1 bar.png 1 foo.png 1 qux.png

B B/:
1 bar.tiff 1 baz.tiff 1 foo.tiff

输出:

$ diff <(getfiles 'A A') <(getfiles 'B B')
1a2
> 1 baz
3d3
< 1 qux

或者,

$ grep -vxFf <(getfiles 'A A') <(getfiles 'B B')
1 baz

限制

如果您的任何文件名中有换行符,这将给出不正确的结果。至少对于 grep形式,这可以扩展到更一般的情况。

关于linux - 在 linux 中,如何仅按文件名比较两个目录并获取不匹配的结果列表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26935515/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com