- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
我想要一个将字符串转换为具有两种不同行为的宽字符串的选项:
在 Windows XP 上我可以这样做:
bool ignore_illegal; // input
DWORD flags = ignore_illegal ? 0 : MB_ERR_INVALID_CHARS;
SetLastError(0);
int res = MultiByteToWideChar(CP_UTF8,flags,"test\xFF\xFF test",-1,buf,sizeof(buf));
int err = GetLastError();
std::cout << "result = " << res << " get last error = " << err;
现在,如果 ignore illegal is true characters 在 XP 上,我会得到:
result = 10 get last error = 0
如果 ignore illegal 是假的,我得到
result = 0 get last error = 1113 // invalid code
所以,给定足够大的缓冲区就足以检查结果!= 0 ;
根据文档 http://msdn.microsoft.com/en-us/library/dd319072(VS.85).aspxAPI 发生了变化,那么这在 Vista 上有何变化?
最佳答案
我认为它的作用是按照 Unicode 标准的规定,用替换字符 (U+FFFD) 替换非法代码单元。以下代码
#define STRICT
#define UNICODE
#define NOMINMAX
#define WIN32_LEAN_AND_MEAN
#include <windows.h>
#include <cstdlib>
#include <iostream>
#include <iomanip>
void test(bool ignore_illegal) {
const DWORD flags = ignore_illegal ? 0 : MB_ERR_INVALID_CHARS;
WCHAR buf[0x100];
SetLastError(0);
const int res = MultiByteToWideChar(CP_UTF8, flags, "test\xFF\xFF test", -1, buf, sizeof buf);
const DWORD err = GetLastError();
std::cout << "ignore_illegal = " << std::boolalpha << ignore_illegal
<< ", result = " << std::dec << res
<< ", last error = " << err
<< ", fifth code unit = " << std::hex << static_cast<unsigned int>(buf[5])
<< std::endl;
}
int main() {
test(false);
test(true);
std::system("pause");
}
在我的 Windows 7 系统上产生以下输出:
ignore_illegal = false, result = 0, last error = 1113, fifth code unit = fffd
ignore_illegal = true, result = 12, last error = 0, fifth code unit = fffd
因此错误代码保持不变,但长度相差了两个,表示已插入两个替换代码点。如果你在 XP 上运行我的代码,如果两个非法代码单元被删除,第五个代码点应该是 U+0020(空格字符)。
关于c++ - Vista 上的 MultiByteToWideChar API 更改,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3447183/
我在 Visual Studio 9.0 上有一个 Visual C++ 应用程序。我们已经使用“Unicode character Set”作为 Character Set 构建了应用程序。我们正在
我有像这样使用 MultiByteToWideChar 的代码: wchar_t * bufferW = malloc(mbBufferLen * 2); MultiByteToWideChar(CP
我正在使用 MultiByteToWideChar 将我的字符串转换为 wstring。我首先尝试为我的 wstring 获取所需的大小。根据将 0 作为最后一个参数传递的文档应该可以完成此操作。使用
以下代码打印了所需的输出,但它在字符串末尾打印了乱码。最后一次调用 MultiByteToWideChar 有问题,但我不知道是什么。请帮忙?? #include "stdafx.h" #includ
此韩语文本(可打印引用)“2013-03-22 =0E?@HD=0F 05:30”无法通过 MultiByteToWideChar 正确转换为 Unicode。 Quoted-printable fo
我正在 std::string 上构建一个合成的 UTF-8 字符串,并尝试使用 MultiByteToWideChar 对其进行转换。这是我的代码: std::string str; str +=
我想将普通的string 转换为wstring。为此,我尝试使用 Windows API 函数 MultiByteToWideChar .但这对我不起作用。 这是我所做的: string x = "T
正如 man 3p mbrtowc 所说,它可能返回四种结果类型:0(如果字节将被解码为 NUL 宽字符) , (size_t)-2 如果序列被截断,(size_t)-1 如果序列非法,以及从零到多字
这是函数: char *ToLowerSTR(/*char*/ WCHAR* buffer) // NEED TO FIX UNRESOLVED EXTERNAL { CHAR* str;
前几天在开发程序时,我必须将 ASCII 字符串转换为 Unicode 字符串。顺便说一句,我正在使用 Visual Studio 2012 在 Windows 上工作。我注意到 Win32 函数 M
我有一个 Excel VBA 项目,我正在适应 64 位 Office。一方面,我调用 MultiByteToWideChar()使用 20 个左右不同的代码页中的任何一个。 (所以 StrConv
我想从 UTF-8 文件中读取一小行并将其显示在 Windows 控制台中。 我使用 MultiByteToWideChar Winapi 函数成功了: void mbtowchar(const ch
我有一个使用 MultiByteToWideChar 将 UTF-8 字符串转换为 UTF-16 的 C++ 代码片段 对于 C++,如果输入是“Hã´tel”,则输出是“Hôtel”,这是正确的 对
我想要一个将字符串转换为具有两种不同行为的宽字符串的选项: 忽略非法字符 如果出现非法字符则中止转换: 在 Windows XP 上我可以这样做: bool ignore_illegal; // in
使用 std::wstring 就像我使用 MultiByteToWideChar 一样? std::wstring widen(const std::string &in) { int le
我正在尝试编写一个可以在 EditControl 中打开和显示 ANSI 和 Unicode 的通用文本编辑器。如果我确定文本是 ANSI,是否需要重复调用 ReadFile()?无法弄清楚如何执
我正在使用一个包装 std::wstring 的类,此代码需要跨平台,是否有 Windows 函数的等价物:Linux 上的 MultiByteToWideChar 和 WideCharToMulti
使用 Win32 API MultiByteToWideChar() 从 Unicode UTF-8 转换为 Unicode UTF-16 时,是否应该使用 MB_ERR_INVALID_CHARS
我有一个函数可以将字符串从各种编码转换为 Windows 内部使用的 Unicode-16。为此,我使用了 MultiByteToWideChar应用程序接口(interface)。但我刚刚发现以下内
我是一名优秀的程序员,十分优秀!