gpt4 book ai didi

linux - 只计算其中有单词的行

转载 作者:太空宇宙 更新时间:2023-11-04 10:52:46 26 4
gpt4 key购买 nike

我怎样才能只计算其中有单词的行数?在下面的示例中,我有四行包含单词:

100314:Status name one: 15
24 1 7 5 43 13 24 64 10 47 31 100 22 20 38 63 49 24 18 82 66 22 21 77 52 8 6 11 50 20 5 1 0
101245:Status name two: 14
2 10 2 2 25 53 3 31 30 1 21 41 9 14 18 40 6 10 18 72 20 16 33 29 19 18 12 60 48 12 8 50 43 13
103765:Yet another name here: 29
45 29 29 475 63 69 47 94 65 65 69 55 53 905 117 57 42 92 90 59 91 52 79 101 192 87 144 74 115 82 78 109 12 96 64 78 111 106 84 19 0 7
102983:Blah blah yada yada: 82
41 37 40 60 82 72 17 41 17 19 43 3

我尝试过使用 wc -lgrep/uniq 的不同管道组合。我也尝试只计算奇数行(在上面的 MWE 中有效),但我正在寻找更通用的大型非结构化数据集。

最佳答案

这取决于你如何定义一个词。例如,如果它是任意两个连续的字母,您可以使用如下内容:

grep -E '[a-zA-z]{2}' fileName | wc -l

您可以根据定义单词的方式简单地调整正则表达式(例如,我提供的单词不会选择“A”或“I”或“I'm”),但概念会保持不变

关于linux - 只计算其中有单词的行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30137888/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com