- xml - AJAX/Jquery XML 解析
- 具有多重继承的 XML 模式
- .net - 枚举序列化 Json 与 XML
- XML 简单类型、简单内容、复杂类型、复杂内容
为什么 binmode as raw 会产生元音变音?能否详细说明“Zurich”字符串在 Perl 中的内部存储方式?只是有点迷路。
use strict;
use warnings;
my $filename = "result-test-encoding-raw.xml";
open(my $fh,'>', $filename) or die "die";
#binmode $fh, ':utf8'; #bad umlaut
binmode $fh, ':raw'; #good umlaut
print $fh '<?xml version="1.0" encoding="UTF-8"?>';
print $fh '<node>';
my $line_text = 'Zürich';
print $fh $line_text;
print $fh ' next ';
$line_text = 'Zürich';
print $fh $line_text;
print $fh '</node>';
close($fh);
最佳答案
你错过了 use utf8;
,它告诉 Perl 你的源代码是使用 UTF-8 编码的。
默认情况下,源文件应使用 US-ASCII 编码。
如果您使用 UTF-8 编码您的源文件,但您没有告诉 Perl(通过使用 use utf8;
),Perl 将把它视为使用 US- ASCII。对于字符串文字,Perl 将简单地将字节映射到字符串字符(而不是拒绝非 ASCII 字符)。这意味着 $line_text
包含 5A.C3.BC.72.69.63.68
。
当您将这些字符传递给带有编码层的文件句柄时,编码层会将这些字符视为 Unicode 代码点 (Zürich
),并生成适当的字节来表示这些字符。
如果您使用 UTF-8 编码您的源文件,并且您将此告诉 Perl(通过使用 use utf8;
),Perl 将把它视为使用 UTF-8 编码(相应地对其进行解码)。这意味着 $line_text
包含 5A.FC.72.69.63.68
。
当您将这些字符传递给具有编码层的文件句柄时,编码层会将这些字符视为 Unicode 代码点 (Zürich
) 并生成适当的字节来表示这些字符。
use strict;
use warnings;
use utf8; # Source code is encoded using UTF-8.
use open ':std', ':encoding(UTF-8)'; # Terminal expects UTF-8. Default encoding for files.
my $filename = "result-test-encoding-raw.xml";
open(my $fh, '>', $filename)
or die("Can't create \"$filename\": $!\n");
...
print $fh 'Zürich';
...
请注意,我使用 :encoding(UTF-8)
而不是 :utf8
。后者是不正确的,即使在这个例子中两者看起来是等价的。
关于xml - Perl utf8 binmode 意外结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46063174/
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 我们不允许在 Stack Overflow 上提出有关通用计算硬件和软件的问题。您可以编辑问题,使其成为
当我尝试在 db2 中创建表时,它抛出以下错误 $ db2 CREATE TABLE employee(emp_id INT NOT NULL, emp_name VARCHAR(100)) sh:
我有: while (i < l) { if (one === two) { continue; } i++; } 但是 JSLint 说: Problem at line 1 chara
所以我有这个代码: char inputs[10] = ""; int numInputs = 0; while (numInputs < 10){ char c; printf("E
var ninja = { name: 'Ninja', say: function () { return 'I am a ' + this.name; }
我收到一个我不明白的错误,请注意,我是编码新手,所以这可能是一个简单的错误。 #include using namespace std; int main() { //Initialise Fahr
我正在使用 javascript 和 react,由于某种原因,我收到了一个奇怪的 token 错误。 这是发生错误的代码: renderNavBar() { if (!this.us
Closed. This question is off-topic。它当前不接受答案。
由于某种我无法解释的原因,编译器正在输出一个错误,指出它发现了一个意外的#else 标记。 这发生在文件的开头: #if defined( _USING_MFC ) #include "stda
这个问题不太可能帮助任何 future 的访问者;它只与一个小的地理区域、一个特定的时间点或一个非常狭窄的情况有关,这些情况并不普遍适用于互联网的全局受众。为了帮助使这个问题更广泛地适用,visit
这个问题在这里已经有了答案: Difference between sh and Bash (11 个答案) 关闭 2 年前。 我正在编写一个简单的 bash 脚本,我在 XX `(' unexpe
关闭。这个问题是not reproducible or was caused by typos .它目前不接受答案。 此问题是由拼写错误或无法再重现的问题引起的。虽然类似的问题可能是 on-topic
我在 Windows 7 上编写了一个脚本,它不断给我一个错误“(此时出乎意料。”对于以下代码 if %vardns%=="NODNS" ( netsh interface ipv4 set ad
我正在尝试使用xmlstarlet(使用xpath)解析XML文件,但是出现语法错误,并且我不知道如何更正我的代码。 这是我的脚本: #!/bin/bash if [ $1=="author" ];
以下脚本旨在在目录中的所有文件上运行程序“senna”,并将每个文件的输出(保留输入文件名)写入另一个目录 for file in ./Data/in/*; do ./senna -iobta
我从 challengers.coffee 运行此代码,并收到错误 ActionView::Template::Error (SyntaxError: [stdin]:3:31:unexpected
我在 config.db.database; 行中有语法错误(意外的标记“.”)。这是我在文件中的代码 const config = require('../config/config') const
这一定很明显,但是我无法使它正常工作。我正在尝试传输应该用于构建$ classKey的对象,这反过来又导致删除所需的软件(amd64或i386)。好吧,这里的代码: $name = @("softwa
我正在使用 1.3.7 版学习 Grails,但我一直无缘无故地遇到以下语法错误: unexpected token: mapping @ line x, column y. 有一次,我通过运行“gr
我正在尝试找出这段Pascal代码的问题 function Factorial(n: integer): integer; begin if n = 0 then Result := 1
我是一名优秀的程序员,十分优秀!