gpt4 book ai didi

python - 使用 awk 进行模式检查

转载 作者:行者123 更新时间:2023-12-04 02:30:23 25 4
gpt4 key购买 nike

有没有办法使用awk或python来检查模式,在我们组中我们有120,000行消息但不知道谁在谁之后回复最多;

考虑以下几行;

  • AA
  • BB
  • AA
  • 抄送
  • AA
  • BB
  • AA
  • AA
  • AA
  • BB
  • 抄送
  • AA

我希望显示结果

  • AA->BB = 3
  • BB->AA = 2
  • AA->CC = 1
  • CC->AA = 2
  • AA->CC = 1
  • BB->CC = 1
  • CC->BB = 0

最佳答案

像这样的东西对你来说可能就足够了:

$ awk 'NR > 1 && prev != $1 { sum[prev"->"$1]++ }
{ prev = $1 }
END { for (a in sum) { print a" = "sum[a] } }
' input.txt
AA->CC = 1
BB->AA = 2
AA->BB = 3
BB->CC = 1
CC->AA = 2
  • 排序是随机的,
  • 它不会打印 AA->CC = 1 两次 ;)
  • 并且它不会打印空关系 CC->BB = 0

关于python - 使用 awk 进行模式检查,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64580175/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com