gpt4 book ai didi

c++ - 如何确定文本文件是否具有 Unicode BOM?

转载 作者:行者123 更新时间:2023-11-30 02:40:03 25 4
gpt4 key购买 nike

如何使用 Qt 类检测 BOM?我想做的是读取一个 UTF-8 文件,处理其内容并将其写回。我可以选择使用 QTextStream 设置或删除 BOM,但我看不到任何方法来保留其原始状态(存在或不存在),因为我无法查询它。

最佳答案

您可以使用QTextCodec::codecForUtfText 来确定字节数组是否有BOM:

QFile *file = ...;
bool hasByteOrderMark = QTextCodec::codecForUtfText(file->peek(4), nullptr) != nullptr;
// QTextCodec is owned by Qt - don't free

作为一种捷径,您可以利用(未记录的)事实,即如果 QTextStream 未能从流中检测到编码,它将关闭 generateByteOrderMark:

QTextStream stream(file);
stream.setAutoDetectUnicode(true);
stream.setCodec(QTextCodec::codecForMib(106)); // default to UTF-8
stream.setGenerateByteOrderMark(true);

stream.readLine(); // detect codec and possibly switch off generateByteOrderMark

int mib = stream.codec()->mibEnum(); // detected codec, or UTF-8 (default set above)
bool hasByteOrderMark = stream.generateByteOrderMark();

这是未记录的行为,因此如果您想依赖它,您可能需要进行测试。

关于c++ - 如何确定文本文件是否具有 Unicode BOM?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29275041/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com