gpt4 book ai didi

perl - 使用 csv 文件复制/重命名带有 utf8 名称的图像

转载 作者:行者123 更新时间:2023-12-04 10:02:10 31 4
gpt4 key购买 nike

我正在编写基于 csv 文件批量重命名和复制图像的脚本。 csv 由第 1 列:旧名称和第 2 列:新名称组成。我想使用 csv 文件作为 perl 脚本的输入,以便它检查旧名称并使用新名称将副本复制到新文件夹中。 (我认为)我遇到的问题与图像有关。它们包含 utf8 字符,如 ß 等。当我运行脚本时,它会打印出这个: Barfu├ƒg├ñsschen 它应该是 Barfußgässchen 和以下错误:

Unsuccessful stat on filename containing newline at C:/Perl64/lib/File/Copy.pm line 148, <$INFILE> line 1.
Copy failed: No such file or directory at X:\Script directory\correction.pl line 26, <$INFILE> line 1.

我知道它与 Binmode utf8 有关,但即使我尝试一个简单的脚本(在这里看到它: How can I output UTF-8 from Perl? ):
use strict;
use utf8;
my $str = 'Çirçös';
binmode(STDOUT, ":utf8");
print "$str\n";

它打印出这个: Ãirþ÷s

这是我的整个脚本,有人可以向我解释我哪里出错了吗? (它不是最干净的代码,因为我正在测试东西)。
use strict;
use warnings;
use File::Copy;
use utf8;

my $inputfile = shift || die "give input!\n";
#my $outputfile = shift || die "Give output!\n";

open my $INFILE, '<', $inputfile or die "In use / not found :$!\n";
#open my $OUTFILE, '>', $outputfile or die "In use / not found :$!\n";

binmode($INFILE, ":encoding(utf8)");

#binmode($OUTFILE, ":encoding(utf8)");

while (<$INFILE>) {
s/"//g;
my @elements = split /;/, $_;

my $old = $elements[1];
my $new = "new/$elements[3]";
binmode STDOUT, ':utf8';
print "$old | $new\n";

copy("$old","$new") or die "Copy failed: $!";
#copy("Copy.pm",\*STDOUT);

# my $output_line = join(";", @elements);
# print $OUTFILE $output_line;
#print "\n"
}

close $INFILE;
#close $OUTFILE;

exit 0;

最佳答案

您需要确保流程的每一步都使用 UTF-8。

创建输入 CSV 时,需要确保将其保存为 UTF-8,最好没有 BOM。 Windows 记事本将添加一个 BOM,因此请尝试使用 Notepad++,它可以让您更好地控制编码。

您还存在 Windows 控制台默认不符合 UTF-8 的问题。见 Unicode characters in Windows command line - how? .使用 chcp 65001 设置代码页或者不要更改 STDOUT 编码。

就您的代码而言,关于新行的第一个错误可能是由于 CSV 的尾随新行。添加 chomp()之后 while (<$INFILE>) {
更新:

要“寻址”文件,您需要在正确的语言环境中对文件名进行编码 - 参见 How do you create unicode file names in Windows using PerlWhat is the universal way to use file I/O API with unicode filenames? .假设您使用的是 Western 1252/Latin,这意味着您的复制命令将如下所示:

copy(encode("cp1252", $old), encode("cp1252", $new))

此外,您的 open 还应该对文件名进行编码:
open my $INFILE,  '<', encode("cp1252", $inputfile)

更新 2:

当您在 DOS 窗口中运行时,删除 binmode(STDOUT, ":utf8");并保留默认代码页。

关于perl - 使用 csv 文件复制/重命名带有 utf8 名称的图像,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13528911/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com