gpt4 book ai didi

c# - 印度 Windows 的默认字符编码是什么?

转载 作者:太空宇宙 更新时间:2023-11-03 10:40:54 26 4
gpt4 key购买 nike

我知道西欧 Windows 的默认编码是 ISO-8859-1,网络标准的默认编码是 UTF8,但我希望(谷歌让我失望)有人知道 Windows/Visual Studio/C# 的默认编码印度的软件?

原因是我们有一家印度公司联系我们的网络服务并收到解析异常,我怀疑他们没有正确设置编码(UTF8),而是使用英语 Windows 默认值(ISO- 8859-1) 有效,所以我正在研究替代方案。

最佳答案

我可能是错的,但经过一些研究后我得出结论,如果他们不使用 en_IN 语言环境,他们就没有用于 GUI 或控制台的代码页。

This MS official source将印地语代码页列为 0。

This random copy of this list说印地语是一种仅限 Unicode 的语言环境。

IANA claims代码页编号 0、1 和 2 被保留。

Here we have Moodle developer谁发现虽然他可以在大多数语言环境下对文本文件使用专门的代码页,但他们不得不求助于印地语语言环境下的 UTF-8(又名代码页 65001)文本文件——在大多数其他 Windows 版本中称为“Unicode 文件”的文件.

Here we have another developer谁发现印地语没有默认代码页。

According to MSDN ,所有语言环境敏感的函数默认为 C 语言环境,这意味着 8 位字符串的 ASCII。

所以:

  1. 没有 Unicode 就无法输入印地语

  2. 印地语语言环境可能将 8 位字符串中所有 >=128 的字节视为无效字符,而在 Windows-1252 中,它们中的大多数都是有效的;我猜应用程序在不考虑编码的情况下执行了太多的字节文本转换(或者那些印度人这样做)

  3. 最后,印度的其他语言也没有 ANSI 代码页

我现在正在使用 Linux,但如果可以的话,我建议在各种语言环境下通过 Applocale 运行程序。我推荐印地语、日语和土耳其语——因为它们最有可能发现错误。

但我敢打赌,他们会离线读取 XML,将其转换为使用默认编码的字符串,然后它就会崩溃。

关于c# - 印度 Windows 的默认字符编码是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25384288/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com