- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我做了什么来在这个路径名中获得如此奇怪的编码?
在我的文件管理器 (Dolphin) 中,路径名看起来不错。
#!/usr/local/bin/perl
use warnings;
use 5.014;
use utf8;
use open qw( :encoding(UTF-8) :std );
use File::Find;
use Devel::Peek;
use Encode qw(decode);
my $string;
find( sub { $string = $File::Find::name }, 'Delibes, Léo' );
$string =~ s|Delibes,\ ||;
$string =~ s|\..*\z||;
my ( $s1, $s2 ) = split m|/|, $string, 2;
say Dump $s1;
say Dump $s2;
# SV = PV(0x824b50) at 0x9346d8
# REFCNT = 1
# FLAGS = (PADMY,POK,pPOK,UTF8)
# PV = 0x93da30 "L\303\251o"\0 [UTF8 "L\x{e9}o"]
# CUR = 4
# LEN = 16
# SV = PV(0x7a7150) at 0x934c30
# REFCNT = 1
# FLAGS = (PADMY,POK,pPOK,UTF8)
# PV = 0x7781e0 "Lakm\303\203\302\251"\0 [UTF8 "Lakm\x{c3}\x{a9}"]
# CUR = 8
# LEN = 16
say $s1;
say $s2;
# Léo
# Lakmé
$s1 = decode( 'utf-8', $s1 );
$s2 = decode( 'utf-8', $s2 );
say $s1;
say $s2;
# L�o
# Lakmé
最佳答案
不幸的是,您的操作系统的路径名 API 是另一个“二进制接口(interface)”,您必须在其中使用 Encode::encode
和 Encode::decode
以获得可预测的结果。
大多数操作系统将路径名视为八位字节序列(即字节)。该序列是否应被解释为 latin-1、UTF-8 或其他字符编码由应用程序决定。因此 readdir()
返回的值只是一个八位位组序列,File::Find
不知道您希望路径名作为 Unicode 代码点。它形成 $File::Find::name
通过简单地将目录路径(您提供的)与您的操作系统通过 readdir()
返回的值连接起来,这就是你如何得到与八位字节混合的代码点。
经验法则:每当将路径名传递给操作系统时,Encode::encode()
它以确保它是一个八位字节序列。从操作系统获取路径名时,Encode::decode()
它是您的应用程序想要的字符集。
您可以通过调用 find
使您的程序运行。这边走:
find( sub { ... }, Encode::encode('utf8', 'Delibes, Léo') );
Encode::decode()
当使用
$File::Find::name
的值时:
my $path = Encode::decode('utf8', $File::Find::name);
$File::Find::name
形成:
use Encode;
# This is a way to get $dir to be represented as a UTF-8 string
my $dir = 'L' .chr(233).'o'.chr(256);
chop $dir;
say "dir: ", d($dir); # length = 3
# This is what readdir() is returning:
my $leaf = encode('utf8', 'Lakem' . chr(233));
say "leaf: ", d($leaf); # length = 7
$File::Find::name = $dir . '/' . $leaf;
say "File::Find::name: ", d($File::Find::name);
sub d {
join(' ', map { sprintf("%02X", ord($_)) } split('', $_[0]))
}
关于perl - 关于路径名编码的问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7546341/
我想了解是什么让 ClearCase 创建这样的路径(不止一个@@):\TUNE\Integration\XmlFiles\PM_Content@@\main\integ_mp1601\4\Commu
我正在构建我的第一个多语言应用程序。通过 Middelware 成功检测到语言并将其附加到 req.lang。下一步,有没有办法也本地化路由路径?这对于 SEO 非常有用。 这里通常的方法是什么? c
如果选择了一个路径,我想向菜单点添加一个类。 如果每个网站都有自己的 .php/.html 文件,那就很容易了,但是一切都在 一个 中规则 .php 文件,所有内容都通过操作进行导航(?action=
我在 Windows 7(最新的 MSMQ 版本)上将 MSMQ.MSMQQueueInfo 与 jscript 一起使用。这是在加入域的计算机上运行的。由于某种我不知道的原因,它只是不接受我给它的
我有很多带空格的文件夹名称,例如“red dog” --> “c:\red dog\” files = dir str = ['cd ', files(3).name] eval(str) 执行返回错
我正在寻找有关如何使用 getopts 显示不带基名的目录名的信息。这应该首先为我计算机中的所有 sh 文件提供基本名称、制表符,然后是所有目录。 例如,如果我这样做:myBashfile.sh -e
我正在尝试自定义由 devise gem 创建的 url: devise_for :users, path: '', path_names: { sign_in: 'login', s
我有以下网址: https://www.example.com/article/f/1/test+article 我需要通过 JavaScript(纯 JavaScript)从 url 中获取“1”部
我们在我们的应用程序中使用了 boost::filesystem。我有一个“完整”路径,它是通过将多个路径连接在一起构建的: #include #include namespace b
Pathname 的 .children 方法返回的文件系统实体的顺序似乎是任意的,或者至少不是按字母顺序排列的。 有没有办法让这些通过文件系统按字母顺序返回,而不是在返回的数组上调用 .sort?
我正在尝试使用 pip 为 python 3 安装 Gelatin,我得到了这个回溯: Traceback (most recent call last): File "", line 1, in
我有一个注册页面的表格。该表单包含一个图像,该图像会根据情况更改其 src。在提交表单时激活的脚本中,如果该图像具有特定的 src,我希望表单调用警报,因此我需要一种检索和比较值的方法。 HTML:
Ruby 的 Dir、File 和 Pathname 类之间有什么区别?它们似乎共享通用方法,如 basename、dirname、glob 和 join。什么时候使用一种比另一种更有优势? 在将其功
我们在我们的应用程序中使用了 boost::filesystem。我有一个“完整”路径,它是通过将多个路径连接在一起构建的: #include #include namespace b
对于以下代码,我不断收到Uncaught TypeError: undefined is not a function: var jay = /^(\/gallery\/P[\w\dåäö\/]+)$
我正在报告从 native 系统 API 收集的一些信息。 (我知道这很糟糕......但我得到了我无法通过其他方式获得的信息,而且如果/当那个时间到来时,我不必更新我的应用程序。) native A
我需要从 Ruby (1.9.3) 中的 DOS (Win32) 路径获取文件的 NT( native )路径。 意思是,我有字符串: dos_path = "C:\Windows\regedit.e
我才刚刚开始使用 ASP.NET MVC,我有一个有点微不足道的问题:似乎每个 Controller 都有一个附加的类似文件夹的路径,所以我的站点变成了 mydomain.net/Home/somet
下面是bunyan logger的__init__函数。 def __init__(self, *args, **kwargs): """Defined default log format
总结 我如何在 C++ 中使用 libarchive 编写一个 zip 文件,这样路径名称将被 UTF-8 编码?使用 UTF-8 路径名时,特殊字符将在使用 OS X/Linux/Windows 8
我是一名优秀的程序员,十分优秀!