- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
请为我解释一下,UTF16 是如何工作的?考虑到以下几点,我有点困惑:
那么,如果一个 UTF16 字符不总是 2 个字节长,那么它还能有多长呢? 3个字节?或者只有 2 的倍数?然后例如,如果有一个 winapi 函数想要知道一个宽字符串的字符大小,并且该字符串包含 2 个字符,每个字符长 4 个字节,那么该字符串的大小如何以字符为单位 计算?
它是 2 个字符长还是 4 个字符长? (因为它是8个字节长,而每个WCHAR是2个字节)
更新:现在我看到字符计数不一定是标准事物或 C++ 事物,所以我将在第二个问题中尝试更具体一些,关于“字符”的长度宽字符串:
在 Windows 上,具体来说,在 Winapi 中,在其广泛的功能(以 W 结尾)中,如何计算由 2 个 unicode 代码点组成的字符串中的字符数,每个代码点由 2 个代码单元(总共 8 个字节)组成?这样的字符串是 2 个字符长(与代码点数相同)还是 4 个字符长(与代码单元总数相同?)
或者,更通用:Windows 定义的“宽字符串中的字符数”是什么意思,是代码点数还是代码单元数?
最佳答案
简短回答:否。
C++ 标准未定义wchar_t
(基本字符单位)的大小(参见第 3.9.1 节第 5 段)。实际上,在 Windows 平台上它是两个字节长,而在 Linux/Mac 平台上它是四个字节长。
此外,字符以特定于字节序的格式存储。在 Windows 上,这通常意味着小端,但对于包含大端数据的 wchar_t
也是有效的。
此外,即使每个 wchar_t
都是两个(或四个)字节长,一个单独的字形(大致是一个字符)可能需要多个 wchar_t
,并且可能有表示它的方式不止一种。
一个常见的例子是字符 é(带尖音符号的拉丁文小写字母 E
),代码点 0x00E9。这也可以表示为“分解的”代码点序列 0x0065 0x0301(即 LATIN SMALL LETTER E
后跟 COMBINING ACUTE ACCENT
)。两者都有效;请参阅关于 Unicode equivalence 的维基百科文章获取更多信息。
简单地说,您需要知道或选择您将使用的编码。如果处理 Windows API,一个简单的选择是假设所有内容都是小端 UTF-16 存储在 2 字节 wchar_t
s 中。
在 Linux/Mac 上,UTF-8(使用 char
s)更为常见,API 通常采用 UTF-8。 wchar_t
被认为是浪费,因为它每个字符使用 4 个字节。
因此,对于跨平台编程,您可能希望在内部使用 UTF-8,并在调用 Windows API 时即时转换为 UTF-16。 Windows 提供 MultiByteToWideChar
和 WideCharToMultiByte
函数来执行此操作,您还可以找到简化使用这些函数的包装器,例如 ATL and MFC String Conversion Macros .
问题已更新为询问 Windows API 在询问字符串中的“字符数”时的含义。
如果 API 表示“字符串的大小(以字符为单位)”,它们指的是 wchar_t
的数量(或者如果您在编译时 char
的数量出于某种原因的非 Unicode 模式)。在那种特定情况下,您可以忽略一个 Unicode 字符可能占用多个 wchar_t
这一事实。这些 API 只是想填充缓冲区,并且需要知道它们有多少空间。
关于c++ - UTF16(例如 wide-winapi 函数所使用的)字符是否总是 2 个字节长?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4652519/
一个非常简单的问题,如果我创建一个 HANDLE在 app1.exe 中,它得到值 0x01这个值是全局唯一的吗? 或者当其他一些进程创建一个 HANDLE 时是否有可能?也有值(value) 0x0
我正在使用winapi-rs crate并尝试获取cpu的使用率,但是我什至无法做到这一点。 PdhCollectQueryData转换为十六进制时将返回“-2147481643”,然后错误代码为“0
有人可以告诉我,在 winapi 中将进度条作为 TreeView 控件的一部分是否现实?我使用 GTK 制作了一个 GUI,并且使用进度条作为单元格元素效果很好,如下图所示。 我没有开发自定义控件的
有 getaddrinfo() 用于阻止主机解析,但是否有非阻塞方法? 最佳答案 我不认为有这样的事情,但你总是可以将它包装在一个线程中并使用信号量来表示完成。 关于winapi - 在 WINAPI
如果我知道 Hwnd,如何获取正在运行的应用程序的图标? 最佳答案 如果你有窗口的句柄,你可以使用 GetClassLong : HICON icon = (HICON)GetClassLong(wi
我正在尝试阅读 IMAGE_DOS_HEADER使用 definition of that structure 的模块来自 winapi箱。 这是我的工作代码: let mut IDH: IMAGE_
我目前正在阅读MSDN的文档,以将流渲染到音频渲染器。 换句话说,就是从麦克风播放我捕获的数据。 http://msdn.microsoft.com/en-us/library/dd316756%28
我有一个问题,希望你能帮我解决。已经没有我的研究运气了...尝试过 stackoverflow、google,甚至 yahoo... 如何在不使用鼠标的情况下强制显示工具提示? 我目前正在实现一些窗口
在 D 中,每次启动应用程序时,我的垃圾收集器都会崩溃。 Windows 模块: pragma(lib, "user32.lib"); import std.string; extern(Window
我正在学习 WinAPI C++ 的绘图形状 我试图在 WM_PAINT 上用一些代码绘制 2 个椭圆: PAINTSTRUCT ps; HDC hdc = BeginPaint(hWnd, &ps)
我使用 PostMessage 模拟鼠标事件并在记事本应用程序上进行了测试。 我不想通过发送鼠标事件来获得记事本应用程序的焦点。 仅当我在 PostMessage 参数中使用记事本的 ChildWin
如何使用 Win32 WinAPI 创建一个 EditBox,使其看起来像在 Visual C# 或 VB 中的 VS 设计器中放置一个编辑框(具有漂亮的顶部边框等)?这是一张图片,展示了它的外观以及
有CopyRect WinAPI function ,它只是复制一个 RECT到另一个。 自从我挖掘它以来,我一直对这个函数存在的原因很感兴趣。 是赋值运算符 ( = ) 还是 CopyMemory功
只是想知道是否有一种方法可以将数字打印到控制台通过调用。它可以是 10 进制,也可以是十六进制,我不介意。 我想看看一些函数返回的格式。 我宁愿不使用 WriteConsole 和大量 asm 来做这
这似乎部分有效,但我无法获取要打印的字符串值 pub fn test() { let mut buf: Vec = vec![0; 64]; let mut sz: DWORD = 0
在 Excel 中使用 Visual Basic,我可以使用 DECLARE 关键字声明 WinAPI 函数 - 例如 Declare Function SetLocaleInfo Lib "kern
..嗨,我有这个代码: #[cfg(windows)] extern crate winapi; use winapi::um::winuser::{FindWindowW, GetClientRec
我有一个 WH_CALLWNDPROC Hook 代码,它处理 WM_INITDIALOG 消息以获取有关消息框的信息。我可以获得“消息”、“标题”、“按钮”,但无法获得“图标”信息。我正在尝试使用如
这是我的源代码: extern crate user32; extern crate kernel32; use std::io::prelude::*; use std::net::TcpStrea
WinAPI OpenFile 函数返回 HFILE,例如 GetFileTime 需要 HANDLE。当我用 (HANDLE)some_hFile 喂它时,它似乎工作正常。这种类型有什么不同吗,或者
我是一名优秀的程序员,十分优秀!