gpt4 book ai didi

c++ - 在 Windows C++ 应用程序中验证输入的 UTF-8 序列

转载 作者:太空宇宙 更新时间:2023-11-04 13:12:27 25 4
gpt4 key购买 nike

我想在用 C++ 编写的 Windows 应用程序中验证输入的 UTF-8 序列。

我的想法是简单地调用 MultiByteToWideChar(),只请求目标字符串长度(而不是将整个字符串转换为 UTF-16),并使用 MB_ERR_INVALID_CHARS 旗帜。
然后,如果函数返回 0(表示失败)并且 GetLastError() 返回 ERROR_NO_UNICODE_TRANSLATION,则意味着输入的 UTF-8 序列包含一些无效数据。

有没有更好的方法?

最佳答案

如果不了解 MBTWC 的内部结构,就很难指定更好的方法。它至少需要对使用 MBTWC 和任何替代方法(如果认为更快更好)进行计时测量。实现您自己的 UTF-8 验证器将是允许比较的开始。你可以找到一个很好的引用实现 here ,看看接受的答案。 Java 代码可以很容易地转换为 C++,并为您提供充足的机会来确定它是否更好(适合您的情况),并在需要时允许进一步改进。

关于c++ - 在 Windows C++ 应用程序中验证输入的 UTF-8 序列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39267546/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com