- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我需要一种方法能够从 UTF-8 编码的文件中读取数据并将其中的数据存储到某种类型的“UTF-8 兼容字符串”中,在 C++ 中。稍后需要将该数据写回 UTF-8 编码文件。谷歌上似乎有很多关于在 Windows 中执行此操作的建议,但我找不到任何适用于 Unix 系统的帮助。
感谢您的帮助!
最佳答案
如果您需要做的只是读写它,那么 std::string 就可以了。
std::ifstream fileIn("file.utf8");
std::string line;
std::getline(fileIn, line); // Reads a UTF-8 line
std::ofstream fileOut("OutFile.utf8");
fileOut << line; // Writes a line of UTF-8 text
之所以可行,是因为没有多字符 UTF 代码点与 ASCII 字符重叠,因此文本的标准处理与行尾序列相关时工作正常,并且流没有进行其他处理。所读即所得。输出字符串不会更改任何代码点。
现在,如果您需要操作文本,那将是一个不同的问题并且会变得更加复杂。
通常操作 UTF-8 非常困难(可以做到,但在 IMO 看来不值得)。
在处理文本时,您希望将 UTF-8(不是固定宽度)转换为内部固定宽度格式; (UTF-16 或 UTF-32 是常用的操作格式,易于使用;(UTF-16 窗口,UTF-32 适用于大多数 *nix 类操作系统))。最简单的方法是为流注入(inject)一个分面,该分面知道输入是 UTF-8 格式并将自动转换它。
在不同的库中有几个这样的方面。但一个容易找到的是提升:
http://www.boost.org/doc/libs/1_38_0/libs/serialization/doc/codecvt.html
注意:也是在boost 1.46的最新版本中
std::locale old_locale;
std::locale utf8_locale(old_locale,new utf8_codecvt_facet<ucs4_t>);
// ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ The important bit
// Note here we are converting to UTF-32(UCS-4)
std::wifstream fileIn;
fileIn.imbue(utf8_locale); // Imbue the stream with the knowledge.
fileIn.open("file.utf8");
// Now read wide characters from the stream. The UTF-8 file is converted
// into UTF-16/UTF-32 for internal processing.
std::wstring wideLine;
std::getline(fileIn, wideLine); // Read a line converting to UTF-16/32
将 UTF-16/32 写回流并将其转换为 UTF-8 的过程相同
std::wofstream fileOut;
fileOut.imbue(utf8_locale);
fileOut.open("OutFile.utf8");
fileOut << wideLine; // Write a UTF-16/32 line and convert into UTF-8
注意。您应该在文件打开之前对其进行灌输。如果您在流打开后对其进行注入(inject),则流的不同实现会有不同的 react 。因此,最好在打开流之前对其进行灌注。
Dinkumware 还有一组转换方面(不确定是否免费)。
http://www.dinkumware.com/manuals/default.aspx?manual=compleat&page=index_cvt.html#Code%20Conversions
注意:我更喜欢使用术语 UTF-X 而不是 UCS-Y。尽管在技术上存在非常细微的差异,但与您在谈论该主题时在两个术语之间切换可能造成的混淆相比,这些差异是无关紧要的。坚持使用一个,除非您需要明确谈论某个功能(例如代理对)。
关于Unix/Mac OS X 上的 C++ UTF-8 支持,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5294014/
我的 processmaker 安装遇到了一些问题。我正在尝试使用本指南 [url]http://wiki.processmaker.com/index.php/ProcessMaker_Ubuntu
我正在使用 ShareKit。发送 SMS 消息使用 MFMessageComposeViewController,用户看到标题“文本”。我想将该标题更改为更能反射(reflect)实际可用内容的内容
我需要在我的一个针对 Gingerbread 的 Android 应用程序中使用操作栏和 fragment 的组合。所以我使用了 v7 支持库中的操作栏和 v4 支持库中的 fragment ,并使用
我明白为什么浏览器 vendor 不想帮助我阻止他们的 UI 线程。但是,我不明白为什么会有: Web Workers 中没有 sleep (2) 没有同步 WebSockets API 有一个syn
最近我的组织正在考虑使用 Docker。我们组使用的是cloudera CDH 5.1.2。 1) cloudera 是否与 Docker 容器兼容?2) docker 和cloudera 组合是否存
我正在尝试通过编译在 Mac 上安装 rsync 3.2.3。但是,我想安装所有功能。为此,它需要一些库,此处 ( https://download.samba.org/pub/rsync/INSTA
我一直在使用 PyDev 成功运行 nose 测试,并想试试 nose2。 所以我安装了它 pip install nose2 复制/粘贴来自 http://nose2.info/ 的示例代码进入名为
我想知道 LLVM 中是否有任何函数/方法可以在 LLVM IR 中添加 Open-MP 构造。 llvm-3.0 是否仍然支持 OpenMP 指令? 最佳答案 OpenMP 是一种高级语言扩展。因此
我对 CUDA 编程非常陌生。我正在浏览 SDK 附带的示例。我能够编译代码,但是当我运行它时,出现以下错误: "clock.cu(177) : CUDA Runtime API error 38:
RStudio 是用于 R 开发的出色 IDE。我想知道是否有任何方法可以很好地支持 HiDPI 分辨率? 我目前有 13 英寸显示器和 3200x1800 分辨率,甚至很难阅读 RStudio 选项
我正在寻找一种有助于为 Django 项目提供 RDF 支持的工具。 到目前为止,我发现了两个: django-rdf - 最后一次修改是在 4 年前,所以它看起来像是一个死项目。 djubby -
我刚刚尝试了一些 JS 核心原则,发现引擎评估链接的关系运算符而不会引发错误。相反,他们以我自己无法理解的方式进行评估。 console.log(1 4 > 3 > 2 > 1); //false,
我知道 etexteditor 和 vim/emacs。 是否有任何其他 Windows 编辑器支持类似 textmate 的片段(例如,您编写触发词,按 Tab,它更改为某些内容,再次按 Tab,它
我正在尝试找出验证给定集群的网络策略配置的最佳方法。 According to the documentation Network policies are implemented by the ne
很难说出这里问的是什么。这个问题是含糊的、模糊的、不完整的、过于宽泛的或修辞性的,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开它,visit the help center 。 已关
Z3 会支持 AUFBV 吗? 对于以下脚本: (set-logic AUFBV) (declare-fun x () (_ BitVec 16)) (declare-const t (Array (
使用分部类编写 NUnit 测试的优缺点是什么? 我要开始了: 亲:可以测试私有(private)方法 缺点:TDD 不再可能了 还有什么? 最佳答案 缺点:要么您必须测试与您发布的版本不同的构建,要
它很容易(对于 90% 的 aop 特性)在没有任何语言本身支持的情况下做到这一点,就像大多数动态语言如 python 和 ruby 一样。然而,Dojo在 1.3.2 上直接支持它.最新版本发生
我在我的 android 应用程序中使用亚洲字符,我已经了解到某些字符无法显示,因为系统字体不支持它们。我查询了一个包含亚洲字符的数据库,并且经常检索到无法显示的标志。这些情况对我的应用程序来说通常不
你好,我想实现一个控件,我想在用户键入@字符时启用该控件,直到未填充运行文本中的空格为止,它应该显示用户列表,@符号后键入的文本应该显示基于键盘字符的建议,就像我们在上面看到的那样Twitter 或
我是一名优秀的程序员,十分优秀!