- mongodb - 在 MongoDB mapreduce 中,如何展平值对象?
- javascript - 对象传播与 Object.assign
- html - 输入类型 ="submit"Vs 按钮标签它们可以互换吗?
- sql - 使用 MongoDB 而不是 MS SQL Server 的优缺点
我最近试图全面了解创建支持 unicode 的独立于平台的 C++ 应用程序需要哪些步骤。令我困惑的一件事是,大多数操作指南和内容都将字符编码(即 ANSI 或 Unicode)和字符类型(char 或 wchar_t)相等。正如我目前所了解到的,这些是不同的东西,可能存在一个用 Unicode 编码但由 std::string 表示的字符序列,以及一个用 ANSI 编码但用 std::wstring 表示的字符序列,对吧?
所以我想到的问题是,C++ 标准是否对以 L
开头的字符串文字的编码提供任何保证,或者它只是说它是 wchar_t 类型,具有实现特定的字符编码?
如果没有这样的保证,这是否意味着我需要某种外部资源系统以独立于平台的方式为我的应用程序提供非 ASCII 字符串文字?这样做的首选方式是什么?资源系统或源文件的正确编码以及正确的编译器选项?
最佳答案
字符串文字前面的 L
符号仅表示字符串中的每个字符都将存储为 wchar_t
。但这并不一定意味着 Unicode。例如,您可以使用宽字符串对 GB 18030 进行编码。 ,在中国使用的一种字符集,类似于Unicode。 C++03 标准对 Unicode 没有任何规定(但是 C++11 定义了 Unicode char types and string literals ),因此您可以在 C++03 中正确表示 Unicode 字符串。
关于字符串字面量,C++ 标准的第 2 章(词汇约定)提到了一个“基本源字符集”,它基本上等同于 ASCII。所以这基本上保证了 "abc"
将被表示为一个 3 字节的字符串(不包括 null),而 L"abc"
将被表示为一个 3 * sizeof(wchar_t)
-byte 宽字符字符串。
该标准还提到了“通用字符名称”,它允许您使用 \uXXXX
十六进制表示法来引用非 ASCII 字符。这些“通用字符名称”通常直接映射到 Unicode 值,但标准不保证它们必须如此。但是,您至少可以通过使用通用字符名称来保证您的字符串将被表示为特定的字节序列。如果运行时环境支持 Unicode、安装了适当的字体等,这将保证 Unicode 输出。
至于 C++03 源文件中的字符串文字,同样不能保证。如果您的代码中有一个 Unicode 字符串文字,其中包含 ASCII 范围之外的字符,则由您的编译器决定如何解释这些字符。如果您想明确保证编译器将“做正确的事”,则需要在字符串文字中使用 \uXXXX
表示法。
关于c++ - 以 L 开头的宽字符串文字(如 L“Hello World”)是否保证以 Unicode 编码?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1810343/
2种参数:尺寸和价格。目前,我只能单击选择/突出显示尺寸列中的一个,也只能单击选择/突出显示价格列中的一个,而不会影响另一个列中的一个。 当我点击尺寸时,会添加一个 URL 参数“#size=4”。单
在css命名约定中,有什么原因,一些object最好以前缀o-和component开头> 以 c- 开头? 我知道 o- 代表 object 而 c- 代表 component,但为什么不呢?难道我们
这就很迷惑了,一下子,下面的代码就不行了。尝试让我的 Android 很好地显示网页已经显示的内容: HttpClient httpclient = new DefaultHttpClient();
我正在将我的网站发布到我无法控制的 IIS 服务器,我想从代码隐藏中了解它的 URL 是否以“http”或“https”开头。 首先,我在本地尝试了这两种解决方案,都返回了正确的值(“http”):
如果我运行: sbin/start-dfs.sh 然后它实际上并没有启动一个名称节点尽管打印: Starting namenodes on [0.0.0.0] 0.0.0.0: starting na
我正在开发一个包含一些数组的模块。现在我的数组包含: $omearray = array ( '#title' = 'title', 0 = array ( 'another array',
对于 PMD,我希望有一个规则来警告我那些以 my 开头的丑陋变量。 这意味着我必须接受所有不以my开头的变量。 所以,我需要一个正则表达式(re),其行为如下: re.match('myVar')
出于某种奇怪的原因,当我尝试使用 URLConnection 获取网页源时,我在输出中得到“null”。有人可以解释一下吗? 我的方法: public String getPageSource()
如何批量检查某个字符串(记录文本文件中的行)是否以特定单词开头? 我知道如何检查句子/行(字符串)中是否存在单词(子字符串),但我如何检查天气是否以这个词开头? 谢谢:) 最佳答案 这可以通过 FIN
我有一个列表,其中包含多个网址和一些字符串,例如#skipsideNav、#content。我正在从这些字符串中分离出 url if link.startswith('/'): local_u
我有以下 html 标记: 我想选择类 bubble bubble_white 和 bubble bubble_black。我正在考虑下面的代码,但它不起作用: $(".bubbl
我有一个用于文件名验证的正则表达式。在这里: /^[0-9a-zA-Z\^\&\'\@\{\}\[\]\,\$\=\!\-\#\(\)\.\%\+\~\_; ]+$/ 如何更改它以检查文件名不是以
我正在构建一个自动填充函数,它接受一个字符串输入并返回一个字符串建议列表。 Sequelize 的 iLike:query返回出现查询字符串的每个字符串。我想支持查询是前缀的字符串。例如当query=
我首先知道这可能是有史以来看起来最糟糕的正则表达式,但这里是。 我有这个正则表达式 (?:http://)?(?:www.)?youtu(?:be)?.(?:[a-z]){2,3}(?:[a-z/?=
尝试读取文件并根据行创建字典,跳过以#符号开头的行 文件示例: param1=val1 # here is comment 我的功能: def readFromFile(name): conf
我的程序正在读取文本文件并根据文本执行操作。但是文本的第一行是有问题的。显然它以“”开头。这弄乱了我的 startsWith() 检查。 为了理解这个问题,我使用了这段代码: System.ou
我的印象是变量名只能以字母和 _ 开头,但是在测试时,我还发现变量名可以以 $ 开头,如下所示: 代码 #include int main() { int myvar=13; int
我试过这个... Dim myMatches As String() = System.Text.RegularExpressions.Regex.Split(postRow.Item("Post")
开头
我正在使用CKEditor,默认情况下在内容的开头添加了。 即使将enterMode设置为,它也只会影响Enter键的作用,并保留开始的。 我遇到的问题是,如果文本以标记开头,它将围绕它包装,并且图像
我有一个List ,其中有五个字符串: abc def ghi jkl mno 我还有另一个字符串“pq”,我需要知道列表中的每个字符串是否都不以“pq”开头-我将如何使用LINQ(.NET 4.0)
我是一名优秀的程序员,十分优秀!