delphi - 如何将 AnsiChar 转换为具有特定 CodePage 的 UnicodeChar？-6ren

delphi - 如何将 AnsiChar 转换为具有特定 CodePage 的 UnicodeChar？

转载作者：行者123 更新时间：2023-12-02 13:59:17

24

4

我正在生成纹理图集，用于在我的应用程序中渲染 Unicode 文本。源文本存储在 ANSI 代码页(1250、1251、1254、1257 等)中。我希望能够从每个 ANSI 代码页生成所有符号。

这是我期望的代码概要:

for I := 0 to 255 do
begin
  anChar := AnsiChar(I); //obtain AnsiChar

  //Apply codepage without converting the chars
  //<<--- this part does not work, showing:
  //"E2033 Types of actual and formal var parameters must be identical"
  SetCodePage(anChar, aCodepages[K], False);

  //Assign AnsiChar to UnicodeChar (automatic conversion)
  uniChar := anChar;

  //Here we get Unicode character index
  uniCode := Ord(uniChar);
end;

上面的代码不起作用(E2033)，我不确定它是否是一个正确的解决方案。也许还有更短的版本。

考虑到特定代码页将 AnsiChar 转换为 Unicode 的正确方法是什么？

最佳答案

我会这样做:

function AnsiCharToWideChar(ac: AnsiChar; CodePage: UINT): WideChar;
begin
  if MultiByteToWideChar(CodePage, 0, @ac, 1, @Result, 1) <> 1 then
    RaiseLastOSError;
end;

我认为您应该避免使用字符串来进行本质上的字符操作。如果您预先知道需要支持哪些代码页，那么您可以将转换硬编码到以数组常量表示的查找表中。

请注意，ANSI 代码页中定义的所有字符都映射到基本多语言平面中的 Unicode 字符，因此由单个 UTF-16 字符表示。因此，上面的代码的大小假设。

但是，您所做的假设(并且该答案仍然存在)是单个字节表示 ANSI 字符集中的字符。对于许多字符集来说，这是一个有效的假设，例如单字节西方字符集(如 1252)。但也有一些字符集(如 932(日语)、949(韩语)等)是双字节字符集。您的整个方法因这些代码页而崩溃。我的猜测是只希望支持单字节字符集。

如果您正在编写跨平台代码，则可以将 MultiByteToWideChar 替换为 UnicodeFromLocaleChars .

关于delphi - 如何将 AnsiChar 转换为具有特定 CodePage 的 UnicodeChar？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/17338460/

24

4

0

文章推荐： angularjs - 使用 nghandsontable 访问 Handsontable 方法/属性

文章推荐： flash - ActionScript DoABC 标签中的奇怪方法

文章推荐： sql - 计算上一季度的最后一天

delphi - 在 UnicodeChar 和 Integer 之间进行类型转换安全吗？
在 2009 年之前的 Delphi(ANSI 版本)中，您可以使用 Ord 和 Chr 将字符转换为字节，反之亦然。这很好，例如当您需要将 char 作为字节操作时: var ch: char;
delphi - 如何将 AnsiChar 转换为具有特定 CodePage 的 UnicodeChar？
我正在生成纹理图集，用于在我的应用程序中渲染 Unicode 文本。源文本存储在 ANSI 代码页(1250、1251、1254、1257 等)中。我希望能够从每个 ANSI 代码页生成所有符号。这

首页

博学

6Ren·AI

商城

delphi - 如何将 AnsiChar 转换为具有特定 CodePage 的 UnicodeChar？