gpt4 book ai didi

windows - 计算文件中未知字符串最常见的出现次数

转载 作者:可可西里 更新时间:2023-11-01 14:41:54 25 4
gpt4 key购买 nike

我有一个大文件,里面全是这样的行......

19:54:05 10.10.8.5 [SERVER] Response sent: www.example.com. type A by 192.168.4.5
19:55:10 10.10.8.5 [SERVER] Response sent: ns1.example.com. type A by 192.168.4.5
19:55:23 10.10.8.5 [SERVER] Response sent: ns1.example.com. type A by 192.168.4.5

我不关心任何其他数据,只关心“响应已发送:”之后的内容我想要一份最常见域名的排序列表。问题是我不会提前知道所有的域名,所以我不能只搜索字符串。

使用上面的示例,我希望输出符合

ns1.example.com (2)
www.example.com (1)

...其中 ( ) 中的数字是该事件的计数。

在 Windows 上我可以如何/使用什么来执行此操作?输入文件是 .txt - 输出文件可以是任何东西。理想情况下是一个命令行过程,但我真的迷路了,所以我对任何事情都很满意。

最佳答案

Cat 有点冒险,所以让我们试着帮点忙。这是一个 PowerShell 解决方案。如果您对其工作方式有疑问,我鼓励您研究各个部分。

如果您的文本文件是“D:\temp\test.txt”,那么您可以这样做。

$results = Select-String -Path D:\temp\test.txt -Pattern "(?<=sent: ).+(?= type)" | Select -Expand Matches | Select -Expand Value
$results | Group-Object | Select-Object Name,Count | Sort-Object Count -Descending

使用你的输入你会得到这个输出

Name             Count
---- -----
ns1.example.com. 2
www.example.com. 1

因为有正则表达式,所以我保存了一个 link that explains how it works .

请记住,SO 当然是一个帮助程序员和编程爱好者的网站。我们将空闲时间投入到一些人为此获得报酬的地方。

关于windows - 计算文件中未知字符串最常见的出现次数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29761164/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com