- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
在 Windows C++ 控制台应用程序中,我想从命令行输入中读取密码。密码用于加密(以及后来的解密,可能在世界其他地方的 Windows PC 上使用不同的语言环境)。所以我担心该密码的语言环境和编码没有给出相同的数字表示。在同一台计算机或具有相同语言环境的计算机上,这显然不会产生问题。
因此我希望能够固定编码(并规范化?)并存储为 UTF-8。这里推荐:http://www.jasypt.org/howtoencryptuserpasswords.html (第 4 点)。
有很多与编码/unicode/UTF-8/codepages 相关的问题我没有完全(或完全没有)掌握。我摆弄了 boost:locale 和 boost::nowide,但无法弄清楚或者它在 Windows 下不起作用(不知道)。一些链接对所涉及的问题(窗口)进行了更多说明:
http://alfps.wordpress.com/2011/11/22/unicode-part-1-windows-console-io-approaches/
http://alfps.wordpress.com/2011/12/08/unicode-part-2-utf-8-stream-mode/
但是这些链接解决了相反的问题!无论底层表示如何,如何使事物看起来都一样,我需要相同的底层 [按位] 表示,无论它看起来如何!
所以问题是,我如何确保(并且我必须这样做?)语言环境/编码对加密的基本数据没有影响,数据,如 8 位数组的意义整数?我不必关心 UTF-8 或 Unicode,只需要能够恢复数据,无论区域设置/编码如何。第一个链接有助于解释问题。
想法,C 不支持 Unicode,链接一些 C 代码会有帮助,还是 C++ 会再次改变它?或者将输入限制为“ASCII”字符(我知道这在 Windows 上不存在)总是有效,就像“在任何 Windows 计算机上”一样)?
接受的解决方案:
void EncryptFileNames ( const boost::filesystem::path& p, const std::string& pw );
int main ( int argc, char **argv ) // No checking
{
// Call with encrypt.exe c:\tmp pässwörd
boost::nowide::args a ( argc, argv ); // Fix arguments - make them UTF-8
boost::filesystem::path p ( argv [ 1 ] );
EncryptFileNames ( p, boost::locale::normalize ( argv [ 2 ], boost::locale::norm_nfc, std::locale ( ) ) );
return 0;
}
感谢所有贡献者。
PS:对于加密,我将 Crypto++ 与 VS2008SP1 和 Boost(没有 ICU 后端)一起使用。
最佳答案
如果您的应用程序是使用 _UNICODE
编译的,那么只需使用 UTF-8 代码页调用 WideCharToMultiByte
即可获得 UTF-8。如果您的应用程序未使用 _UNICODE
编译,请调用 MultiByteToWideChar
从 ACP 字节中获取 UTF-16,然后调用 WideCharToMultiByte
获取 UTF- 8.
由于您添加的代码显示了 std::string,数据可能在系统的 ACP 中。所以这里的食谱会奏效。现在,有很多方便的 API 可用于此目的,例如 mbtowcs
。不要被“MB”分心。这只是 Windows 所说的“非 UTF-16”。
关于c++ - 使用固定编码的字符串到字节序列的转换,最好是 UTF-8,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12330672/
UTF-8、UTF-16 和 UTF-32 之间有何区别? 据我所知,它们都将存储 Unicode,并且每个都使用不同数量的字节来表示字符。选择其中之一是否有优势? 最佳答案 当 ASCII 字符代表
好的。我知道这看起来像典型的“他为什么不直接用谷歌搜索或去 www.unicode.org 查一下?”问题,但对于这样一个简单的问题,在检查了两个来源后,我仍然无法回答。 我很确定这三种编码系统都支持
是否存在可以用 UTF-16 编码但不能用 UTF-8 编码的字符 最佳答案 没有。 UTF-* 是可以对全范围 Unicode 字符进行编码的编码。 编码之间的差异在于每个字符使用多少字节。 关于u
是否存在可以用 UTF-16 编码但不能用 UTF-8 编码的字符 最佳答案 没有。 UTF-* 是可以对全范围 Unicode 字符进行编码的编码。 编码之间的差异在于每个字符使用多少字节。 关于u
UTF-16 是一种双字节字符编码。交换两个字节的地址将产生 UTF-16BE 和 UTF-16LE。 但我发现在 Ubuntu gedit 文本编辑器中存在名称 UTF-16 编码,以及 UTF-1
我想将 UTF-16 字符串转换为 UTF-8。我通过 Unicode 发现了 ICU 库。我在转换时遇到问题,因为默认设置是 UTF-16。我试过使用转换器: UErrorCode myError
UTF-16 需要 2 个字节,UTF-8 需要 1 个字节。 而USB是面向8bit的,UTF-8更自然。 UTF-8 向后兼容 ASCII,而 UTF-16 则不然。 UTF-16 需要 2 个字
我对将 unicode 字符转换为十六进制值有点困惑。 我正在使用这个网站获取字符的十六进制值。 ( https://www.branah.com/unicode-converter ) 如果我输入“
我已经用UTF-8编码创建了一个文件,但是我不了解其在磁盘上占用的大小的规则。这是我的完整研究: 首先,我创建了一个带有印地语字母“'”的文件,Windows 7上的文件大小为 8个字节。 现在带有两
如何将WideString(或其他长字符串)转换为UTF-8中的字节数组? 最佳答案 这样的功能将满足您的需求: function UTF8Bytes(const s: UTF8String): TB
我有一个奇怪的验证程序,用于验证utf-8字符串是否是有效的主机名(PHP中的Zend Framework主机名valdiator)。它允许IDN(国际化域名)。它将比较每个子域与由其十六进制字节表示
在 utf16 和 utf32 中,一个字节的零是否意味着空?就像在 utf8 中一样,还是我们需要 2 个和 4 个字节的零来相应地在 utf16 和 utf32 中创建 null? 最佳答案 在
这是基于我的观察,对于 mysql,默认字符集 utf8 有点误导,它不支持完整的 Unicode,因为它无法存储四字节 UTF-8 编码的字符。它实际上是 utf8mb4 字符集,它是完整的 Uni
我只有处理 ASCII(单字节字符)的经验,并且阅读了很多关于人们如何以不同方式处理 Unicode 的帖子,这些帖子提出了他们自己的一系列问题。 此时我对 Unicode 的了解非常有限,我读到过U
我明白 std::codecvt在 C++11 中执行 UTF-16 和 UTF-8 之间的转换,并且 std::codecvt执行 UTF-32 和 UTF-8 之间的转换。是否可以在 UTF-8
我正在编写一个 HTTP 服务器并使用 trivial-utf-8:write-utf-8-bytes 来响应请求。我听说Babel就像trivial-utf-8但效率更高,所以我想试一试。搜索了一段
我正在设计一个新的 CMS,但想要设计它来满足我 future 的所有需求,比如多语言内容,所以我认为 Unicode (UTF-8) 是最好的解决方案 但是通过一些搜索我得到了这篇文章 http:/
例如,假设我在字符串中有以下 xml: 如果我尝试将其插入到带有 Xml 列的 SQL Server 2005 数据库表中,我将收到以下错误(我使用的是 EF 4.1,但我认为这无关紧要): XM
我正在使用 Python CSV 库读取两个 CSV 文件。 一种使用 UTF-8-BOM 编码,另一种使用 UTF-8 编码。在我的实践中,我发现使用“utf-8-sig”作为编码类型可以读取这两个
假设我的数据库设置如下以使用 utf-8(mysql 中的完整 4mb 版本) mysql_query("SET CHARACTER SET utf8mb4"); mysql_query("SET N
我是一名优秀的程序员,十分优秀!