gpt4 book ai didi

localization - 语言代码和语言环境代码的良好定义是什么?

转载 作者:行者123 更新时间:2023-12-03 09:07:46 26 4
gpt4 key购买 nike

  • 何时使用 en_GBen-GB ?
  • 有什么不同 ?
  • ISO 639-1 是否有 ISO 名称? (语言)和 ISO 3166 (国家)组合?
  • 最佳答案

    有几个用于区域设置标识符的系统。乍一看,它们中的许多都是相似的,但当你更深入时,它们就不是了:

    一些例子(Serbian-Serbia with Latin Script,Japanese-Japan with自由基排序):

  • UTS-35、ICU、Mac OS X、Flash:sr-Latn-RS、ja-JP@collat​​ion=radical
  • 较新的 UTS-35,BCP 47 扩展 U:sr-Latn-RS,ja-JP-u-co-unihan
  • 赢 2000, XP: 0x81a, 0x10411
  • Vista,Win 7:sr-Latn-CS,ja-JP_radical
  • Java: sr_CS, ja_JP
  • Java 7:sr_RS,ja_JP
  • Linux: sr_RS@latin, ja_JP.utf8

  • 把它想象成谈论颜色的不同方式(RGB、CMYB、HSV、Pantone 等)

    所以 -_除非您指定您正在使用的环境是什么,否则没有意义。使用 - Java 看不懂,用 _ Windows 不会理解它。
    ICU(以及建立在它之上的系统)同时接受 -_ , 但产生 _风格。

    没有涵盖语言国家组合的 ISO。但是有些 ISO 涵盖了各个部分(语言、国家、脚本)。
    ISO 的确切版本还取决于用于区域设置标识符的系统。

    一般来说,您应该同时接受 _- , 并且只生成一个(“在你接受的东西上要自由,在你发出的东西上要严格”)(比如 ICU)。

    如果您使用其他类型的区域设置标识符与系统通信,则必须映射到/从您的系统。这将迫使你使用 _- .
    一些映射将是有损的(无法在 Windows、Linux 中指定备用日历;或在 7 之前的 Java 中指定备用排序或脚本等)并且可能无法进行往返(有点类似于转换 RGB- CMYK)。

    加法:事情不仅在系统之间有所不同,而且可以随时间变化。例如,Java 7 增加了对 sr_RS 和脚本的支持,Windows 不断增加对更多语言环境的支持,新的国家被创建(苏丹 split 、俄罗斯、塞尔维亚)或消失(东德、苏联、南斯拉夫)等等。

    对于内部表示,您可能想要选择最强大的,可以表示一切,那就是 UTS-35/BCP 47(也被 CLDR 和 ICU 使用)。

    关于localization - 语言代码和语言环境代码的良好定义是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6152321/

    26 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com