- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在从事一个处理外语数据的项目。我的 Perl 脚本运行良好。
然后我想使用 Tie::File,因为这是一个简洁的概念(并且可以节省时间和编码)。
似乎 Tie:File 在 Unicode/UTF-8 下失败(除非我遗漏了什么)。
这是一个描述问题的程序:(数据是英语、希腊语和希伯来语的混合体):
use strict;
use warnings;
use 5.014;
use Win32::Console;
use autodie;
use warnings qw< FATAL utf8 >;
use Carp;
use Carp::Always;
use utf8;
use feature qw< unicode_strings>;
use charnames qw< :full>;
use Tie::File;
my ($i);
my ( $FileName);
my (@Tied);
binmode STDOUT, ':unix:utf8';
binmode STDERR, ':unix:utf8';
binmode $DB::OUT, ':unix:utf8' if $DB::OUT; # for the debugger
Win32::Console::OutputCP(65001); # Set the console code page to UTF8
$FileName = 'E:\\My Documents\\Technical\\Perl\\Eclipse workspace\\Work\\'.
'Tie File test res.txt';
tie @Tied, 'Tie::File', $FileName, recsep => "\x0D\x0A", discipline => ':encoding(utf8)'
or confess 'tie @Tied failed';
$i =0;
while (<DATA>) {
chomp;
$Tied[$i] = $_;
++$i;
} # end while (<DATA>)
$i =0;
foreach (@Tied) {
say "$i $Tied[$i]";
++$i;
} # end foreach (@Tied)
untie $FileName;
__DATA__
τι κάνετε;
πάρτε το ή αφήστε το
שלום חברים
abc לא כןכן efg
מתי ולאן This is it
מעכשיו לעכשיו
Σήμερα είναι Τρίτη
Θέλω να φάω
τι κάνετε;
שורה מס' 5
utf8 "\xCE" does not map to Unicode at F:/Win7programs/Dwimperl/perl/lib/Tie/File.pm line 917
Tie::File::_read_record('Tie::File=HASH(0x24cb72c)') called at F:/Win7programs/Dwimper
l/perl/lib/Tie/File.pm line 175
Tie::File::_fetch('Tie::File=HASH(0x24cb72c)', 0) called at F:/Win7programs/Dwimperl/p
erl/lib/Tie/File.pm line 210
Tie::File::STORE('Tie::File=HASH(0x24cb72c)', 0, 'τι κάνετε;') called at tie file test
.pl line 31
utf8 "\xCF" does not map to Unicode at F:/Win7programs/Dwimperl/perl/lib/Tie/File.pm line 917
Tie::File::_read_record('Tie::File=HASH(0x24cb72c)') called at F:/Win7programs/Dwimper
l/perl/lib/Tie/File.pm line 175
Tie::File::_fetch('Tie::File=HASH(0x24cb72c)', 0) called at F:/Win7programs/Dwimperl/p
erl/lib/Tie/File.pm line 210
Tie::File::STORE('Tie::File=HASH(0x24cb72c)', 0, 'τι κάνετε;') called at tie file test
.pl line 31
utf8 "\xD7" does not map to Unicode at F:/Win7programs/Dwimperl/perl/lib/Tie/File.pm line 917
Tie::File::_read_record('Tie::File=HASH(0x24cb72c)') called at F:/Win7programs/Dwimper
l/perl/lib/Tie/File.pm line 175
Tie::File::_fetch('Tie::File=HASH(0x24cb72c)', 0) called at F:/Win7programs/Dwimperl/p
erl/lib/Tie/File.pm line 210
Tie::File::STORE('Tie::File=HASH(0x24cb72c)', 0, 'τι κάνετε;') called at tie file test
.pl line 31
utf8 "\xD7" does not map to Unicode at F:/Win7programs/Dwimperl/perl/lib/Tie/File.pm line 917
Tie::File::_read_record('Tie::File=HASH(0x24cb72c)') called at F:/Win7programs/Dwimper
l/perl/lib/Tie/File.pm line 175
Tie::File::_fetch('Tie::File=HASH(0x24cb72c)', 0) called at F:/Win7programs/Dwimperl/p
erl/lib/Tie/File.pm line 210
Tie::File::STORE('Tie::File=HASH(0x24cb72c)', 0, 'τι κάνετε;') called at tie file test
.pl line 31
0 τι κάνετε;
1 πάρτε το ή αφήστε το
2 שלום חברים
3 abc לא כןכן efg
4 מתי ולאן This is it
5 מעכשיו לעכשיו
6 Σήμερα είναι Τρίτη
7 Θέλω να φάω
8 τι κάνετε;
9 שורה מס' 5
10
11
12
13
14 \xA4\xΘέλω\xA8\x
15
16
17
18
19
τι κάνϏN͏Ŏՠτήστε של חברءbc לؗܗࠗܗߠeמתולאן This is מעיו לעכ؎Ďώݎ֏ναι ΤρΘέώގѠφϏŎ٠κτε;שרה מס'
\xA4\xΘέλω\xA8\x
最佳答案
我提出的建议很大程度上取决于您要解决的实际问题。孤立地看这个问题,我不会有那么多的编码/解码“魔法”,而只会使用原始字节(因为脚本不需要知道任何关于这个任务的字符本身)。给定您描述的输入和输出,下面会产生预期的结果。
use v5.014;
use warnings;
use autodie;
use Carp::Always;
use Tie::File;
my $file_in = 'test_in.txt';
my $file_out = 'test_tie.txt';
unlink $file_out;
tie my @tied, 'Tie::File', $file_out, recsep => "\x0D\x0A" or die 'tie failed';
open my $fh, '<', $file_in;
while (my $line = <$fh>) {
chomp $line;
push @tied, $line;
}
close $fh;
my $i = 0;
say $i++ . ' ' . $_ foreach @tied;
untie @tied;
seek
调用时,perldoc 在 seek (
http://perldoc.perl.org/functions/seek.html) 上有这样的说法:
Note the in bytes: even if the filehandle has been set to operate on characters (for example by using the :encoding(utf8) open layer), tell() will return byte offsets, not character offsets (because implementing that would render seek() and tell() rather slow).
binmode
当依赖外部模块读取/写入文件句柄时 - 在这种情况下,我将有一个简单的子调用
Encode::encode('UTF-8', ...)
在推送到@tied 之前先查看数据。
关于perl - 为什么我的 Perl 程序使用 Tie::File 和 Unicode/UTF-8 编码失败?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13209474/
假设我有一个自定义类型(我可以扩展): struct Foo { int a; string b; }; 如何使该对象的实例可分配给 std::tie ,即 std::tuple引用文
我在 SQL Server 中寻找类似的东西: SELECT TOP n WITH TIES FROM tablename 我知道 PostgreSQL 中的 LIMIT,但是否存在与上述等效的内容?
我的脚本似乎有一个小问题,我需要对脚本中较早的子例程调用“tied”,以便我可以访问与哈希绑定(bind)的对象相关的函数到。问题是,当我运行脚本时,它返回错误“无法在 cbc_encrypt_tes
关闭。此题需要details or clarity 。目前不接受答案。 想要改进这个问题吗?通过 editing this post 添加详细信息并澄清问题. 已关闭 8 年前。 Improve th
论文网址: https://dl.acm.org/doi/10.1145/3404835.3462961 。 Arxiv: https://arxiv.org/abs/2104.08419
这是我试图解决 weekly 的挑战 #2 . 挑战很模糊,所以我决定尝试用内存来实现一个标量值。我对容器应该如何工作的理解可能有缺陷,但我真正不明白的是,为什么 say self.VAR.WHAT是
在阅读 Haskell 相关的东西时,我有时会遇到“打结”这个表达,我想我理解它的作用,但不理解它的作用。 那么,对于这个概念有什么好的、基本的、简单易懂的解释吗? 最佳答案 打结是循环数据结构问题的
如何保留哈希元素的添加顺序对于第二个VAR? (哈希值的哈希值) 例如: use Tie::IxHash; my %hash; tie %hash, "Tie::IxHash"; for my $nu
我打算编写一个简单的文本查看器,我希望它能够处理非常大的文件。我正在考虑使用 Tie::File为此,并对行进行分页。这是懒惰地加载行,还是一次加载所有行? 最佳答案 它不会加载整个文件。来自 doc
我有一个 [String: Int] 类型的字典,它的值为 let dic = [“a”:4, “b”:3, “c”:3] 我想按值和使用方法对字典进行排序 dic = dic.sorted(by:
当一个函数需要返回两个参数时,你可以使用 std::pair 编写它: std::pair f() {return std::make_pair(1,2);} 如果你想使用它,你可以这样写: int
在 c++11 中,std::tie 是否允许隐式转换? 以下代码编译并运行,但我不确定幕后到底发生了什么,或者这是否安全。 std::tuple foo() { return std::make_t
std::tie 返回一个引用元组,因此您可以执行以下操作: int foo, bar, baz; std::tie(foo, bar, baz) = std::make_tuple(1, 2, 3)
我目前正在开发一款问答游戏。我写了一个 Team 类,一个 Question 类和一个 Round 类。 这是我的团队类(我不会发布属性、构造函数和方法,因为它们与我的问题无关)。 public cl
我正在阅读 a bit about tuples . 现在我不清楚以下语法: std::tie (myint, std::ignore, mychar) = mytuple; 理解它的作用并不难,但是
是否有与 Perl 等效的 Ruby Tie::File模块? 最佳答案 没有。 读取文件并将行作为 Array 返回很容易,就像在 Perl 中一样: array = File.readlines(
我使用 std::tie 并没有考虑太多。它有效,所以我刚刚接受了这一点: auto test() { int a, b; std::tie(a, b) = std::make_tuple
tying-the-knot 策略可用于构建图,例如,使用简单的两条边图作为示例: data Node = Node Node Node -- a - b -- | | -- c - d squa
#!/usr/bin/perl use strict; use warnings; use Tie::File; use Data::Dumper; use Benchmark; my $t0 = B
我写了一个花哨的“zip 迭代器”,它已经完成了许多角色(可以用于 for_each、复制循环、容器迭代器范围构造函数等......)。 在处理所涉及的对/元组的所有模板代码下,归结为迭代器的解引用运
我是一名优秀的程序员,十分优秀!