- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在处理三个文本文档。第一个是主输入(输入 1),其中单词和单词类型(名词、动词等)由制表符分隔。
输入1
John N
goes V
to P
school N
. S
Mary N
comes V
from P
home N
. S
第二个和第三个输入文本文件如下所示:
输入2
John
Mary
输入3
to
from
我的目标是将第二个和第三个文本文件与主输入进行比较和匹配,并获得如下输出:
预期输出:
John N N
goes V
to P P
school N
. S
Mary N N
comes V
from P P
home N
. S
所有三列均应以制表符或空格分隔。但是,我得到这样的输出:
John N
N
goes
V
to P
P
school
N
.
S
Mary N
N
comes
V
from P
P
home
N
.
S
我相信当我将第一个文本文件的输入放入数组并打印值时,就会发生这种情况。请建议一种获得所需输出的方法。
我使用的程序代码如下:
#!/usr/bin/perl
use warnings;
use strict;
my @file = ('Input 1.txt');
open my $word_fh, '<', 'Input 2.txt' or die $!;
open my $word2_fh, '<', 'Input 3.txt' or die $!;
my %words_to_match = map {chomp $_; $_ => 0} <$word_fh>;
my %words_to_match2 = map {chomp $_; $_ => 0} <$word2_fh>;
close $word_fh;
close $word2_fh;
check($_) for @file;
sub check {
my $file = shift;
open my $fh, '<', $file or die $!;
while (<$fh>){
chomp;
my @words_in_line = split;
for my $word (@words_in_line){
$word =~ s/[(\.,;:!)]//g;
$word .= ' N' if exists $words_to_match{$word};
$word .= ' P' if exists $words_to_match2{$word};
print "$word\n";
}
print "\n";
}
同样,目标是获得所有三列均由制表符或空格分隔的输出。
最佳答案
如果您首先读取所有引用文件并从中构建数据结构,然后读取主要输入文件并对其进行转换,事情就会变得容易得多
您使用两个哈希值,%words_to_match
和 %words_to_match2
并存储每个元素的值为零。这是浪费信息,最好的办法是构建一个单个哈希,将每个引用文件中的单词与其词性相关联。 Input 2.txt
中的单词是名词,因此它们得到 N
,而 Input 3.txt
中的单词是介词,因此它们得到一个P
然后您只需检查是否存在与Input 1.txt
中的每个单词匹配的哈希元素,如果存在,则在打印记录之前附加其值
下面的程序创建一个如下所示的哈希 %pos
,它将两个引用文件中的每个单词与其词性关联起来
( from => "P", John => "N", Mary => "N", to => "P" )
在最后的输入循环中,我使用了替换 s///
将所有尾随空格(包括换行符)替换为三个空格和词性。制表符对于布局表格来说没有什么用处,首先是因为没有人能就制表符停止位置达成一致,其次是因为单个制表符并不总是将列对齐。根据前面数据中有多少个字符,您有时可能需要两个或更多
我希望它是清楚的
use strict;
use warnings 'all';
use autodie;
my %words;
my %files = (
'input 2.txt' => 'N',
'input 3.txt' => 'P',
);
while ( my ( $file, $pos ) = each %files ) {
open my $fh, '<', $file;
while ( <$fh> ) {
s/\s+\z//;
$words{$_} = $pos;
}
}
{
open my $fh, '<','input 1.txt';
while ( <$fh> ) {
next unless /\S/;
my ($word) = split;
my $pos = $words{$word};
s/\s+\z/ $pos\n/ if $pos;
}
continue {
print;
}
}
John N N
goes V
to P P
school N
. S
Mary N N
comes V
from P P
home N
. S
关于perl - 用制表符/空格分隔输出,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37974486/
如果我的 Perl 程序使用 Perl 模块,它将如何确定在哪里可以找到包含模块代码的文件? 例如,如果程序包含: use MyModule1; # Example 1 us
我在一个文件中有一些不同格式的数字:8.3、0.001、9e-18。我正在寻找一种简单的方法来读取它们并存储它们而不会损失任何精度。这在 AWK 中很容易,但在 Perl 中是如何完成的呢?我只愿意使
我在一个文件中有一些不同格式的数字:8.3、0.001、9e-18。我正在寻找一种简单的方法来读取它们并存储它们而不会损失任何精度。这在 AWK 中很容易,但在 Perl 中是如何完成的呢?我只愿意使
我正在自学 Perl,并且在我的 Windows 8 64 位系统上安装了 Strawberry。 Strawberry 命令行似乎工作正常,我在 C 驱动器上的 Strawberry 文件夹中创建了
我在 Perl 模块 IO::Socket::SSL 中发现了一个错误,我可能会修复它,但是,我担心测试修复。我从 Debian 下载了源码包(因为我打算为它制作一个 Debian 包或补丁)并查看了
我有一个 perl 文件,它使用了两个 perl 模块 A.pm 和 B.pm。 但是在 B.pm 中我需要调用 A.pm 的子程序。即使我在 A.pm 中使用并尝试使用它,我仍然遇到未定义的错误。
有没有办法在 Perl 运行时加载整个模块?我原以为我用 autouse 找到了一个很好的解决方案,但以下代码无法编译: package tryAutouse2; use autouse 'tryAu
过去,我编写过许多 perl 模块,以及不止一些独立的 perl 程序,但我之前从未发布过多文件 perl 程序。 我有一个几乎处于 beta 阶段的 perl 程序,它将被开源发布。它需要一些数据文
我有 1 个 perl 脚本,我们在其中编写了几个子例程。例子: # Try_1.pl main(); sub main{ --- --- check(); } check { -- --} 现在,
似乎 CPAN 上的一些(很多?)模块部分是使用 XS 在 C 中实现的,如果需要,可以回退到纯 perl 实现。虽然这很聪明,但它显然会损害性能,我想知道它是否会发生,以便我可以解决问题。 有没有一
我对 perl 很陌生。我希望我可以从 perl 安装一些软件包,我这样做是这样的: perl -MCPAN -e 'install VM::EC2' 我猜它由于依赖而失败,它显示: Result:
给定一个 Perl 包 Foo.pm,例如 package Foo; use strict; sub bar { # some code here } sub baz { # more
我有一个用 Perl 编写的测试生成器。它生成连接到模拟器的测试。这些测试本身是用 Perl 编写的,并通过其 API 连接到模拟器。我希望生成的代码是人类可读的,这意味着我希望它能够正确缩进和格式化
我正在学习 Perl,非常新的用户。我可以知道这些 Perl 代码之间有什么区别吗? #!/usr/bin/perl & #!/usr/bin/perl -w 最佳答案 那不是 perl 代码,它是
我不认为这是一个重复的问题。这专门针对 Perl 模块附带的脚本。 通常,在安装多个 Perl 版本时,您可以将 perl 可执行文件标记为版本号 (perl5.32),这样它们就可以在 /whate
我有一个在文件中使用 Blowfish 加密的程序和第二个 perl 程序,它提示输入用于将其解密为字符串的密码,我希望不必将解密的源代码写入硬盘驱动器,尽管将它放在内存中并不是真正的问题,因为运行程
有没有人为 Perl 中的惰性求值列表找到了一个好的解决方案?我尝试了很多方法来改变类似的东西 for my $item ( map { ... } @list ) { } 进入懒惰的评估——例如,通
我安装了多个版本的 Perl。 我已经指定了要使用的版本。但是为了验证,我想从 .pl 脚本本身输出 Perl 的版本。 这可能吗? 在 Perl 脚本中解析“perl --version”的输出似乎
人们还经常问“我怎样才能编译 Perl?”而他们真正想要的是创建一个可以在机器上运行的可执行文件,即使他们没有安装 Perl。 我知道有几种解决方案: perl2exe靛蓝之星 它是商业的。我从未尝试
关闭。这个问题是opinion-based .它目前不接受答案。 想改进这个问题?更新问题,以便 editing this post 可以用事实和引用来回答它. 8年前关闭。 Improve this
我是一名优秀的程序员,十分优秀!