gpt4 book ai didi

linux - 如何检测文本文件中大于 n 的 "hollows"序列(孔、不匹配模式的线)?

转载 作者:太空狗 更新时间:2023-10-29 11:25:41 27 4
gpt4 key购买 nike

案例场景:

$ cat Status.txt
1,connected
2,connected
3,connected
4,connected
5,connected
6,connected
7,disconnected
8,disconnected
9,disconnected
10,disconnected
11,disconnected
12,disconnected
13,disconnected
14,connected
15,connected
16,connected
17,disconnected
18,connected
19,connected
20,connected
21,disconnected
22,disconnected
23,disconnected
24,disconnected
25,disconnected
26,disconnected
27,disconnected
28,disconnected
29,disconnected
30,connected

可以看出,存在“空心”,将它们理解为序列文件中带有“disconnected”值的行

事实上,我想检测这些“漏洞”,但如果我可以设置一个最小n 缺失数字,这将很有用 在序列中。
即:对于“n=5”,可检测到的孔将是 7...13 部分,因为序列中至少连续有 5 个“断开连接”。但是,在这种情况下,不应将缺少的 17 视为可检测的。同样,在第 21 行 whether 得到一个有效的断开连接。

类似于:

$ detector Status.txt -n 5 --pattern connected
7
21

...这可以解释为:

- Missing more than 5 "connected" starting at 7.
- Missing more than 5 "connected" starting at 21.

我需要在 Linux shell 上编写脚本,所以我在考虑编写一些循环、解析字符串等,但我觉得这是否可以通过使用 linux shell 来完成工具,也许还有一些更简单的编程。有办法吗?

即使像 csvtool 这样的小程序是一个有效的解决方案,一些更常见的 Linux 命令(如 grepcutawk sedwc...等)在使用嵌入式设备时对我来说可能是值得的。

最佳答案

#!/usr/bin/env bash
last_connected=0
min_hole_size=${1:-5} # default to 5, or take an argument from the command line
while IFS=, read -r num state; do
if [[ $state = connected ]]; then
if (( (num-last_connected) > (min_hole_size+1) )); then
echo "Found a hole running from $((last_connected + 1)) to $((num - 1))"
fi
last_connected=$num
fi
done

# Special case: Need to also handle a hole that's still open at EOF.
if [[ $state != connected ]] && (( num - last_connected > min_hole_size )); then
echo "Found a hole running from $((last_connected + 1)) to $num"
fi

...发出,给定您在标准输入 (./detect-holes <in.txt) 上的文件:

Found a hole running from 7 to 13
Found a hole running from 21 to 29

参见:

  • BashFAQ #1 - 如何逐行(和/或逐字段)读取文件(数据流、变量)?
  • The conditional expression -- [[ ]]用于在不引用扩展的情况下安全地进行字符串比较的语法。
  • Arithmetic comparison syntax -- 有效于 $(( ))在所有符合 POSIX 标准的 shell 中;也可以在没有扩展副作用的情况下使用 (( ))作为 bash 扩展。

关于linux - 如何检测文本文件中大于 n 的 "hollows"序列(孔、不匹配模式的线)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48490357/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com