gpt4 book ai didi

character-encoding - Lua String 字符编码

转载 作者:行者123 更新时间:2023-12-05 02:23:57 24 4
gpt4 key购买 nike

我看不到 Lua 对其字符串使用什么编码。

我正在使用

string.byte (s [, i [, j]])

里面有文档

Returns the internal numerical codes of the characters s[i], s[i+1], ···, s[j]. The default value for i is 1; the default value for j is i. Note that numerical codes are not necessarily portable across platforms.

阅读周围的人建议它使用 ASCII - 这对我来说很好 - 但我没有得到跨平台的变化 - 我认为使用单一编码(如 ASCII)的本质是这不会发生 - 或者只是这么说是因为 ASCII 没有为超过 126(或 127)定义,因此不同的国家/OEM/OS 等可能使用几十年前的自定义 ASCII 扩展来达到上限?

知道 [a-zA-Z] 在我运行的所有平台上将具有相同的字符值对我来说很重要。

Lua 文档在这里可以更具体一些!

任何人都可以对此有所了解,谢谢

最佳答案

我相当确定您可以安全地假设一个 ASCII 派生编码。因此,您感兴趣的极小字符集保持不变。

关于代码在平台之间变化的说明可能意味着 Lua 对字符编码一无所知,因此只使用操作系统分发的任何字节。在 Linux 上,这可能是 UTF-8,这意味着您在超出 ASCII 范围时必须处理单独的代码单元。在 Windows 上,我可以想象它是系统的遗留代码页,这在西方世界的大部分地区意味着某种拉丁语 1 (CP 1252)。

关于character-encoding - Lua String 字符编码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17879997/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com