gpt4 book ai didi

正则表达式匹配不会在 perl 中产生输出

转载 作者:行者123 更新时间:2023-12-05 08:49:42 24 4
gpt4 key购买 nike

我有一个看起来像这样的测试文件:

t # 3-0, 1
v 0 0
v 1 19
v 2 2
u 0 1 2
u 0 2 2
u 1 2 2
t # 3-1, 1
v 0 0
v 1 15
v 2 2
u 0 1 2
u 0 2 2
u 1 2 2
t # 3-2, 1
v 0 0
v 1 17
v 2 2
u 0 1 2
u 0 2 2
u 1 2 2
t # 3-3, 1
v 0 0
v 1 18
v 2 7
u 0 1 2
u 0 2 2
u 1 2 2

我写了下面的代码来匹配交易的最后三行(每笔交易都以t#开头)

#!/usr/bin/perl -w

use strict;

my $input = shift @ARGV or die $!;

open (FILE, "$input") or die $!;

LOOP: while (<FILE>) {
if (m/^(t\h*#\h*[0-9,\h-]+)/) {
my $transaction_id = $1;
while (<FILE>) {
if (m/^(u\h+[0]\h+[1]\h+[2])/) {
my $edge_1 = $1;
while (<FILE>) {
if (m/^(u\h+[0]\h+[2]\h+[2])/) {
my $edge_2 = $1;
while (<FILE>) {
if (m/^(u\h+[1]\h+[2]\h+[2])/) {
my $edge_3 = $1;
print $transaction_id . "\t" . $edge_1 . "\t" . $edge_2 . "\t" . $edge_3 . "\n";
next LOOP;
}
}
}
}
}
}
}
}

close FILE;

但是,它不会打印任何结果。当我编译我的程序时,它运行没有错误。我的最终目标是产生这样的输出,我输出子图“u 0 1 2”、“u 0 2 2”和“u 1 2 2”的边:

t # 3-0, 1   u 0 1 2   u 0 2 2   u 1 2 2
t # 3-1, 1 u 0 1 2 u 0 2 2 u 1 2 2
t # 3-2, 1 u 0 1 2 u 0 2 2 u 1 2 2
t # 3-3, 1 u 0 1 2 u 0 2 2 u 1 2 2

最佳答案

一种方法:将事务的所有行保存在缓冲区中,当您到达新的事务 ID 时,存储前一个事务以及该缓冲区中的最后三行

use warnings;
use strict;
use feature 'say';

my (@transactions, @trans_lines, $tid);

while (<>) {
chomp;

if (/^(t\s*#\s*[0-9,\s-]+)/) {
if (not $tid) {
$tid = $1; # the very first one starts
next;
}

# Store previous id and its last three lines, reset
push @transactions, [ $tid, @trans_lines[-3..-1] ];
$tid = $1;
@trans_lines = ()
}

push @trans_lines, $_;
}


say "@$_" for @transactions;

这将所有交易存储在一个数组中,因此它们很容易迭代并保持文件中的顺序。这支持使用问题中展示的结果。但是对于一个数组,不能轻易地引用一个特定的数组,如果有兴趣能够查找特定的 id,请考虑使用数组引用的散列来代替,就像在 related problem 中一样。 .

上述代码依赖于事务中始终存在三行,正如问题中所隐含的那样。我建议添加一张支票。

构造 while (<>)读取命令行上给定的所有文件的行,或 STDIN .


对发布代码的一些评论

  • use warnings;比使用 -w switch 更好

  • $! variable保存错误字符串。虽然它确实应该被广泛使用,但如果@ARGV shift 为空返回 undef并且没有错误;所以$!未设置。相反,做类似的事情

    my $file = shift @ARGV  // die "Usage: $0 file\n";

    或者,更好的是,使用更完整的用法消息等调用您的例程。

  • 使用词法文件句柄open my $fh, '<', $file or die $!; ,因为它们在很多方面明显优于 globs ( FH )

  • 没有必要对一个单独的标量变量进行双引号,因为它无论如何都会被求值(而在某些情况下过多的引号甚至会导致微妙的问题)

  • 从同一资源(此处为文件句柄)读取的嵌套循环是合法的并且有其用途,但它增加了一层复杂性并使代码更难跟踪。我会非常非常谨慎地使用它。多层嵌套增加了更多的复杂性。

我不明白为什么问题中的代码不起作用。添加打印语句?

关于正则表达式匹配不会在 perl 中产生输出,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63442271/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com