gpt4 book ai didi

unicode - IBM 大型机上 Shift-JIS 的日语 COBOL 代码;传输到PC后如何表示?

转载 作者:行者123 更新时间:2023-12-01 04:21:49 25 4
gpt4 key购买 nike

我们有一个日本客户,在大型机上有 COBOL 源代码。他声称大型机上的代码用 Shift-JIS2 表示(我们认为我们很好理解)。当该代码传输到 PC 时,最常用的编码是什么?
我们已经向他发送了一个程序来处理该 COBOL 代码,但它似乎卡住了。客户不会直接给我们代码,所以实验很难。他的实验似乎表明是 UTF-8;我假设在 Shift-JIS2 中可编码的日语字符相应地转换为 Unicode 等效项。有人在这里有任何经验吗?

编辑:我认为我们解开了我们的谜团。客户(废话!)在 PC 上使用 CP-932(“ShiftJIS”),但他的 COBOL 程序在标识符中包含日语字符,这就是我们的工具窒息的原因。

编辑:跟进:更多的是一个惊喜。 SHIFT-JIS 通常将我们认为的 ASCII 文本编码为所谓的“FULLWIDTH”字符,它们与东亚象形文字占据相同的屏幕空间;常规 ASCII 字符充当半角。所以,有一个全宽“A”
, "B", ... "Z"以及 FULLWIDTH "-"。显然,要处理日语 COBOL,我们的 COBOL 解析器不仅必须接受西方 ASCII,还必须接受 FULLWIDTH 等价物,尤其是。 FULLWIDTH 字母和令人惊讶的 FULLWIDTH 连字符用于在 COBOL 标识符中分隔“字母”。

编辑:IBM Enterprise COBOL 允许在标识符中使用 DBCS 字符。哎呀!

最佳答案

有三种编码在日本仍然广泛使用:EUC-JP、ISO-2022-JP 和 Shift-JIS。

ISO-2022-JP 通常用于电子邮件。虽然您会在 Unix 机器上看到 EUC-JP。不过,我个人没有处理过 Shift-JIS 以外的任何东西。 (也不是大型机。)

关于unicode - IBM 大型机上 Shift-JIS 的日语 COBOL 代码;传输到PC后如何表示?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1309909/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com