- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我在打开 UTF-8 路径文件时遇到问题。具有 UTF-8 字符(如西里尔字母或拉丁字母)的路径。我找到了一种使用 _wfopen
解决该问题的方法,但解决该问题的方法是手动使用 UTF (\Uxxxx) 对 UTF-8 字符进行编码。
是否有函数、宏或任何东西,当我提供字符串(路径)时它会返回 Unicode??
是这样的: https://www.branah.com/unicode-converter
我尝试使用 MultiByteToWideChar
但它返回一些不相关的十六进制数字。
尝试过:
std::wstring s2ws(const std::string& s)
{
int len;
int slength = (int)s.length() + 1;
len = MultiByteToWideChar(CP_ACP, 0, s.c_str(), slength, 0, 0);
wchar_t* buf = new wchar_t[len];
MultiByteToWideChar(CP_ACP, 0, s.c_str(), slength, buf, len);
std::wstring r(buf);
delete[] buf;
return r;
}
std::wstring stemp = s2ws(x);
LPCWSTR result = stemp.c_str();
我得到的结果:0055F7E8
提前致谢
我安装了 boost,现在我想用 boost 来做。有人能帮我提高一下吗。
所以我有一条路:wchar_t path[100] = _T("čaćšžđ\\test.txt");
我需要将其转换为:
wchar_t s[100] = _T("\u010d\u0061\u0107\u0161\u017e\u0111\\test.txt");
最佳答案
这是一种在 Windows 上在 UTF-8 和 UTF-16 之间转换的方法,以及显示输入和输出的存储代码单元的实际值:
#include <codecvt>
#include <iostream>
#include <iomanip>
#include <string>
int main() {
std::wstring_convert<std::codecvt_utf8_utf16<wchar_t>, wchar_t> convert;
std::string s = "test";
std::cout << std::hex << std::setfill('0');
std::cout << "Input `char` data: ";
for (char c : s) {
std::cout << std::setw(2) << static_cast<unsigned>(static_cast<unsigned char>(c)) << ' ';
}
std::cout << '\n';
std::wstring ws = convert.from_bytes(s);
std::cout << "Output `wchar_t` data: ";
for (wchar_t wc : ws) {
std::cout << std::setw(4) << static_cast<unsigned>(wc) << ' ';
}
std::cout << '\n';
}
了解输入和输出的实际值很重要,否则您可能无法正确理解您真正需要的转换。例如,在我看来,对于 VC++ 如何处理编码,以及 \Uxxxxxxxx
和 \uxxxx
在 C++ 源代码中的实际作用(例如,它们不一定会生成 UTF-8 数据)。
尝试使用上面显示的代码来查看输入数据的真实情况。
强调我上面写的内容;有强烈的迹象表明您可能没有正确理解对您的输入进行的处理,您需要彻底检查它。
上述程序确实正确地将 ć (U+0107) 的 UTF-8 表示形式转换为单个 16 位代码单元 0x0107
,如果您将测试字符串替换为以下内容:
std::string s = "\xC4\x87"; // UTF-8 representation of U+0107
然后,在使用 Visual Studio 的 Windows 上,该程序的输出是:
Input
char
data: c4 87
Outputwchar_t
data: 0107
这与您使用测试字符串形成对比,例如:
std::string s = "ć";
或者
std::string s = "\u0107";
这可能会导致以下输出:
Input
char
data: 3f
Outputwchar_t
data: 003f
这里的问题是 Visual Studio 不会毫无技巧地使用 UTF-8 作为字符串的编码,因此您从 UTF-8 转换的请求可能不是您真正需要的;或者您确实需要从 UTF-8 进行转换,但您正在使用与实际输入不同的输入来测试潜在的转换例程。
So I have a path: wchar_t path[100] = _T("čaćšžđ\test.txt");
I need it converted to:
wchar_t s[100] = _T("\u010d\u0061\u0107\u0161\u017e\u0111\test.txt");
好的,如果我理解正确的话,你的实际问题是以下失败:
wchar_t path[100] = _T("čaćšžđ\\test.txt");
FILE *f = _wfopen(path, L"w");
但是如果你改为这样写字符串:
wchar_t path[100] = _T("\u010d\u0061\u0107\u0161\u017e\u0111\\test.txt");
然后 _wfopen
调用成功并打开您想要的文件。
首先,这与 UTF-8 完全无关。我假设您找到了一些使用 char
字符串并将其转换为 wchar_t
的解决方法,并且您以某种方式将其解释为涉及 UTF-8 或其他内容。
你用什么编码保存源代码?字符串 L"čaćšžđ\\test.txt"
实际上是否正确保存?尝试关闭源文件并重新打开它。如果某些字符显示为 ?
,则部分问题出在源文件编码上。 Windows 在北美和西欧的大部分地区使用的默认编码尤其如此:“西欧 (Windows) - 代码页 1252”。
您还可以检查以下程序的输出:
#include <iomanip>
#include <iostream>
int main() {
wchar_t path[16] = L"čaćšžđ\\test.txt";
std::cout << std::hex << std::setfill('0');
for (wchar_t wc : path) {
std::cout << std::setw(4) << static_cast<unsigned>(wc) << ' ';
}
std::cout << '\n';
wchar_t s[16] = L"\u010d\u0061\u0107\u0161\u017e\u0111\\test.txt";
for (wchar_t wc : s) {
std::cout << std::setw(4) << static_cast<unsigned>(wc) << ' ';
}
std::cout << '\n';
}
您需要了解的另一件事是,书写字符的 \uxxxx
形式(称为通用字符名称或 UCN)不是一种可以在 C++ 中与字符串相互转换的形式。当您编译程序并运行时,即当您编写的任何代码可能会尝试生成包含 \uxxxx
的字符串时,UCN 被编译器解释为不同字符的时间早就过去了。唯一可行的 UCN 是直接写入源文件的 UCN。
此外,您错误地使用了 _T()
。 IMO 你根本不应该使用 TCHAR
和相关的宏,但如果你确实使用它,那么你应该始终如一地使用它:不要将 TCHAR
API 与显式使用 *W API 或 wchar_t
。 TCHAR
的全部意义在于允许代码独立并在那些 wchar_t
和 Microsoft 的“ANSI”API 之间切换,因此使用 TCHAR
然后对 TCHAR
是 wchar_t
的假设进行硬编码会破坏整个目的。
你应该只写:
wchar_t path[100] = L"čaćšžđ\\test.txt";
关于c++ - 在unicode c++中编码路径,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35329149/
BufferedImage image = ImageIO.read(SpriteSheet.class.getResource(path)); BufferedImage image = Image
希望有人能够帮助我解决将我的 React 应用程序推送到 Heroku 时遇到的问题。 heroku 日志反复显示以下错误。 at=error code=H10 desc="App crashed"
我是 Kotlin 的新手,我正在经历这样的例子。 . . package com.example.lambda1 import spark.Spark.get fun main(args: Arra
如果您已经安装了 32 位 JDK,请在中定义一个 JAVA_HOME 变量 Computer>System Properties>System Setting>Enviorment VAriable
我正在开发一个独立于平台的应用程序。我收到一个文件 URL*。在 Windows 上,这些是: file:///Z:/folder%20to%20file/file.txt file://host/f
我在 OSX、Objective-C 上。 我有一个像 这样的路径/NSURL /Users/xxx/Desktop/image2.png 但我将它传递给第三方应用程序,该应用程序会像 excpect
我已经安装了 Android studio 和插件的 DART,FLUTTER 来启动 flutter,但是因为我在创建我的第一个 flutter 项目时无法提供 sdk 路径。 最佳答案 我试图找出
127.0.0.1:8000/api/仅包含来自第二个应用程序的 url,但我将两个 url 模块链接到相同的模式。甚至有可能做到这一点吗? 第一个应用程序: from django.urls imp
对于大量图像(大约 1k,加上相同数量的拇指,在大约 500 个文件夹中),我们要求网站上使用的所有图像 URI 都必须具有 SEO 优化路径。它们已经准备好并提供完整的路径结构(每个文件夹包含一个具
为什么 f 不是一个文件?什么可能导致这种情况? String currentPhotoPath = "file:/storage/sdcard0/Pictures/someFileName.
Gradle 中的项目名称或路径中允许使用哪些字符? 它是否与特定操作系统的目录名称中允许的字符相同(例如: http://en.wikipedia.org/wiki/Filename#Reserve
我有一个包含文件夹路径的表格。我需要找到层次结构中这些文件夹之间的所有“差距”。我的意思是,如果表格包含这 3 个文件夹: 'A' 'A\B\C' 'A\B\C\D\E\F\G' 我需要在层次结构中找
我在 Linux 服务器上的/home/subversion 中安装了 svn - 那里有一个 ROOT 文件夹,其中包含 db 和 conf 等文件夹。没有映射到项目名称的文件夹,请有人告诉我如何列
对于我的图像位置:/src/assets/bitmap/sample.jpg 给出了关键配置: context: resolve('src') output: { path: resolve('b
我需要创建带有圆角的 SVG 路径,以将它们导出到 DXF 进行切割。我的问题是角应该是圆弧,而不是贝塞尔曲线。 使用 arc 命令相对容易处理直角,因为半径也是从拐角到圆弧起点的距离。对于其他角度,
大家好,我正在玩 Airflow,我正在阅读这篇很有帮助的 tutorial .我正在寻求帮助以更好地了解 Admin->Connection 如何在 Conn Type: File (path) 方
我的目标是定义R将用于安装和搜索库的单个路径。我read可以通过更改Rprofile.site安装路径中的R文件来完成。我在那里尝试了两个命令: .libPaths("D:/RLibrary") .L
我有一个问题:当我在一个页面中时,我想返回到上一页。我使用 $routeProvider。如何读取之前的 url? 我尝试在我的 Controller 中使用此代码但不起作用... angular.m
我正在尝试将一个文件从我的主干合并到一个分支(wc),并且对于看起来位于当前合并操作中不涉及的分支上的路径出现奇怪的未找到路径错误。 例如,在我们的 svn 项目中,我们有: 分行 分支 0 分支 1
我有一个树数据序列化如下: 关系:P到C是“一对多”,C到P是“一对一”。所以列 P 可能有重复的值,但列 C 有唯一的值。 P, C 1, 2 1, 3 3, 4 2, 5 4, 6 # in da
我是一名优秀的程序员,十分优秀!