gpt4 book ai didi

regex - Grep 删除 sem 相似的行?

转载 作者:IT王子 更新时间:2023-10-29 01:14:58 24 4
gpt4 key购买 nike

我正在读取这样的文件:

cat access_logs | grep Ruby

确定哪些 IP 正在访问我的文件之一。它返回一个巨大的列表。我想删除半重复项,即这两行在技术上是相同的 - 除了具有不同的时间/日期戳。在包含数千个重复的庞大列表中 - 有没有办法只获取唯一的 IP 地址?

1.2.3.4 - - [13/Apr/2014:14:20:17 -0400] "GET /color.txt HTTP/1.1" 404 207 "-" "Ruby"
1.2.3.4 - - [13/Apr/2014:14:20:38 -0400] "GET /color.txt HTTP/1.1" 404 207 "-" "Ruby"
1.2.3.4 - - [13/Apr/2014:15:20:17 -0400] "GET /color.txt HTTP/1.1" 404 207 "-" "Ruby"
1.2.3.4 - - [13/Apr/2014:15:20:38 -0400] "GET /color.txt HTTP/1.1" 404 207 "-" "Ruby"

例如,那 4 行将被修剪成只有一行?

最佳答案

你可以这样做:

awk '/Ruby/{print $1}' file | sort -u

或者您可以使用 grep + cut 获取评论中建议的第一列。

关于regex - Grep 删除 sem 相似的行?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23046717/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com