★ > ok 但是,如果-6ren">
gpt4 book ai didi

unicode - UTF-8 二进制文件必须在 Erlang 的二进制文字中包含/utf8 吗?

转载 作者:行者123 更新时间:2023-12-04 15:22:29 25 4
gpt4 key购买 nike

在erlang中,定义UTF-8二进制字符串时,需要在二进制文字中指定编码,如下所示:

Star = <<"★"/utf8>>.
> <<226,152,133>>
io:format("~ts~n", [Star]).
> ★
> ok

但是,如果 /utf8 encoding 被省略,unicode 字符处理不正确:
Star1 = <<"★">>.
> <<5>>
io:format("~ts~n", [Star1]).
> ^E
> ok

有没有一种方法可以创建这样的文字二进制字符串而无需指定 /utf8在我创建的每个二进制文件中?我的代码有很多这样的二进制文件,事情变得非常困惑。有没有办法为二进制文件设置某种默认编码?

最佳答案

这可能是 Erlang 字符串和列表的歧义的结果。当您输入 <<"★">> , Erlang 实际看到的是 <<[9733]>> ,当然,这只是一个包含整数的列表。因此,我相信在这种情况下,Erlang 会将 9733 编码为一个整数,很可能是 16 位(尽管我肯定会错)。
/utf8 flag 向 Erlang 表明这应该是一个 UTF8 字符串,从而向 VM 提示如何最好地编码它遇到的整数。

关于unicode - UTF-8 二进制文件必须在 Erlang 的二进制文字中包含/utf8 吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24315971/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com