gpt4 book ai didi

unix - 一个文件中的打印行与另一文件中的模式匹配

转载 作者:行者123 更新时间:2023-12-03 14:30:14 24 4
gpt4 key购买 nike

我的文件超过40.000行(文件1),我想提取与文件2中的模式匹配的行(约6000行)。我像这样使用grep,但是它非常慢:
grep -f file2 file1 > out

是否有使用awksed进行此操作的更快方法?

这是我文件的一些摘录:

File1:
scitn003869.2| scign003869 CGCATGTGTGCATGTATTATCGTATCCCTTG
scitn007747.1| scign007747 CACGCAGACGCAGTGGAGCATTCCAGGTCACAA
scitn003155.1| scign003155 TAAAAATCGTTAGCACTCGCTTGGTACACTAAC
scitn018252.1| scign018252 CGTGTGTGTGCATATGTGTGCATGCGTG
scitn004671.2| scign004671 TCCTCAGGTTTTGAAAGGCAGGGTAAGTGCT




File2:
scign000003
scign000004
scign000005
scign004671
scign000013


`

最佳答案

尝试grep -Fwf file2 file1 > out

-F选项指定纯字符串匹配,因此应该更快,而不必使用正则表达式引擎。

关于unix - 一个文件中的打印行与另一文件中的模式匹配,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21388825/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com