gpt4 book ai didi

regex - 提取文件名

转载 作者:行者123 更新时间:2023-12-01 10:45:39 25 4
gpt4 key购买 nike

我正在编写一个脚本,该脚本从目录中获取文件列表,打开每个文件,然后搜索包含具有 .zip 扩展名的文件名的行。然后我想从该行中删除文件名。这是我的代码:

foreach (@fnames) {
chomp ($_);
open FILE, '<', "$_";
@archives = grep { /.+?\.zip/ } <FILE>;

foreach (@archives) {
if ($_ =~ /("|>)(.+?)("|<)/) { push @files, $2; }
}
}

我从中提取数据的文件将在双引号或尖括号之间包含 .zip 文件名。这段代码没有返回任何内容,但我知道文件名在那里。如果我在终端中执行 grep,我可以看到所有这些,但是 Perl 中的 grep 没有给我任何东西。有什么想法吗?

最佳答案

可能的错误:

  • @fnames 是空的,因为代码中的一些错误你不是展示。
  • open FILE, ... 失败,但由于您没有检查返回值在 open 中,它默默地失败了,因此你不知道它。使用 open ... or die $!
  • 您的输入中包含大写字母,例如ZIP,不要使用grep 中的 /i 忽略大小写选项。顺便说一句, .+? 在开头是相当无用的,除非你期望不需要的字符串以.zip(即它只检查前面至少有一个字符)。
  • 第二个循环中的 if 语句只会获取第一个匹配。

还有:

  • 您应该使用 open 的词法文件句柄。
  • 您应该使用严格和警告,如果您还没有这样做的话。
  • my @archivesmy @files 在适当的词法范围内会有所帮助确保您获得并保留所需的数据。
  • $_ =~/.../ 可以简单地写成 /.../ 以获得更好的可读性(海事组织)。
  • 您(真的)不需要转换变量。
  • ("|>)[">] 的多余说法。
  • grep 是冗余处理。你可以简单地做:

while (<FILE>) {
push @files, /[">](.*\.zip)["<]/ig;
}

简而言之:

my @files;
foreach my $file (@fnames) {
chomp $file;
open my $fh, '<', $file or die $!;
while (<$fh>) {
push @files, /[">](.*\.zip)["<]/ig;
}
}
print "File names found: @files\n";

关于regex - 提取文件名,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8393415/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com