gpt4 book ai didi

windows - 从两组文本文件中提取独特的行

转载 作者:可可西里 更新时间:2023-11-01 10:03:06 25 4
gpt4 key购买 nike

在 A: 和 B: 两个目录中的每一个目录中都有 1 个或多个 文本文件。目的是打印一个单个文本文件,其中包含所有行,这些行出现在A:中。

(每个文本文件最多可能包含 200 万行。如果 A: 有 2 行或更多行[即,仅在 A: 中,而不在 B: 中]彼此相同,则只有其中之一行需要列在 unique.txt 输出中。顺序列表 [sort] 并不重要。)

归功于 Lieven Keersmaekers对于下面的脚本(干净且快速)。然而,我似乎陷入了在 unique.txt 文件中被截断的行(在字符 120 处;或换行),而不是像它们一样完全打印整个独特的行存在于 A:.

compare -r $(gc C:\a\*.txt | sort -u) -d $(gc C:\b\*.txt | sort -u) | ? {$_.SideIndicator -eq '<='} | select inputobject | Out-File unique.txt

我试着用这些来获得完整的、展开的线条,但没有成功:

Format-Table -Wrap -AutoSize |

我做错了什么? Windows cmd linePowerShell 都可以。

最佳答案

使用 sort -ubashcombine :

combine <(sort -u a/* ) not <(sort -u b/*)

以上假设不需要重复的行,并且 Windows 文件系统安装在 Linux 机器上,或者可以从 Linux 机器访问。

请注意,combine 不需要排序的数据,它可以按任何给定顺序显示来自 A:\* 的行,并返回未排序 输出,例如:

combine <(cat a/*) not <(cat b/*)

...但是,如果 A:\* 包含的给定行的重复项多于 B:\*,这将失去不显示重复行的属性。

关于windows - 从两组文本文件中提取独特的行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46679413/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com