gpt4 book ai didi

regex - 查找多次出现的单词

转载 作者:塔克拉玛干 更新时间:2023-11-03 01:51:58 24 4
gpt4 key购买 nike

我有一个文本文件,其中每一行都是一组逗号分隔的单词。我需要知道是否重复了一个单词,如果重复了,在哪几行中重复了。示例:

word1, word2, word3, word4, word5
word6, word4, word7, word8

输出:

word4: 1,2

我正在试验一个 perl 脚本,它在逐行读取文件时创建从单词到行号的映射,但我想知道是否有更简单的方法。

最佳答案

在打印任何内容之前,您需要阅读所有行,所以您描述的就是您必须做的,但事实证明做起来非常简单。

my %seen;
while (<>) {
for (split /\s*,\s*/) {
push @{ $seen{$_} }, $.;
}
}

for my $word (keys(%seen)) {
next if @{ $seen{$word} } < 2;
print($word . ": " . join(",", @{ $seen{$word} }) . "\n");
}

关于regex - 查找多次出现的单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28771669/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com