gpt4 book ai didi

c++ - 在 linux 上调试时如何显示 Unicode 字符串?

转载 作者:IT王子 更新时间:2023-10-29 01:20:36 26 4
gpt4 key购买 nike

作为使用 MS Visual Studio 的 C++ 开发人员,我已经工作了几年作为工作平台。由于我私下更喜欢使用linux,所以我最近采取了也有机会将我的工作环境转移到 Linux。由于我多年来一直在优化我的Windows环境,当然,事实证明有几件事丢失了或没有按预期工作。因此,我有一些问题,我还没有得到有用的答案。

让我们开始下面的问题,稍后可能会出现不同的问题。问题是我已经多次偶然发现的问题,每当我被迫在非 Windows 平台上调试特定于平台的错误时。

简单来说:如何在linux调试时显示Unicode(UCS2编码)字符串?

现在我想出了一些更多的细节。我们的库内部使用基于 Unicode 的String 类,它将每个字符编码为 16 位 Unicode 值(但我们不支持多字编码,因此我们基本上只能使用 UCS2 可编码子集UTF16,但这包括几乎所有使用过的脚本)。这已经造成了一个问题,因为大多数平台(即 linux/unix)都考虑wchar_t 类型由 4 个字节组成,而在 Windows 上它只有 2 个字节,因此我不能简单地将内部字符串缓冲区转换为 (wchar_t *),所以我不确定,如果这真的对任何调试器有帮助的话。

对于 gdb 我想,我可以从调试代码中调用函数,以打印调试信息。因此我在我们的库中插入了一个特殊的函数,可以任意转换字符串数据并将其写入新缓冲区。目前我将我们的内部缓冲区转码为 utf8,因为我希望这样最有可能工作。

但到目前为止,这只解决了部分问题:如果字符串是拉丁字符串,然后我现在得到一个可读的输出(而不能直接打印拉丁语数据,如果它是 16 位编码),但我还必须处理其他脚本(f.e. CJK (a.k.a. Hansi/Kanji), cyrillic, greek ...) 我的意思是交易我必须使用此类脚本专门调试数据,因为直接使用的脚本影响控制流。当然,在这些情况下,我只看到与多个对应的 ISO 字符组成 utf8 字符的字节,这使得调试 CJK 数据更加困难然后正确显示的字符串将是神秘的。

通常 gdb 允许设置多个主机和目标编码,因此它应该可以将正确编码的 utf8 数据流发送到控制台。

但我当然更愿意使用 IDE 进行调试。目前我正在尝试与eclipse和CDT交 friend ,但为了调试我也测试了kdgb。在这两个应用程序中,到目前为止我只能获得错误解码的 utf8 数据。另一方面,我曾经在 windows 平台上的 eclipse 中调试过一个 java 项目并且所有内部字符串都正确显示(但这个应用程序不是使用我们的库和相应的字符串),因此至少在某些情况下eclipse 可以正确显示 unicode 字符。

对我来说最烦人的一点是,到目前为止我什至想不出任何证明显示真正的 unicode 数据(即非 ISO 字符)有效的证据在 linux 上的任何设置中(即我发现的 QString 的 gdb 脚本,似乎只显示拉丁字符并跳过其余部分),当然几乎每个 linux 应用程序似乎都支持 unicode 数据,因此有一定是周围的人,在 linux 平台上调试真正的 unicode 数据我真的无法想象,他们都在阅读十六进制代码而不是直接显示unicode字符串。

因此,任何指向允许调试 unicode 字符串的设置的指针,基于在任何其他字符串类(例如 QString)和/或 IDE 上也将不胜感激。

最佳答案

上面 Charles Salvia 提到的简单脚本“wchar.gdb”对我有帮助,但几年后很难找到(文章中的链接已损坏),因此我将其粘贴在这里。该脚本还演示了 gdb 中内置的一些鲜为人知的宏功能。

define wchar_print
echo "

set $i = 0
while (1 == 1)
set $c = (char)(($arg0)[$i++])
if ($c == '\0')
loop_break
end
printf "%c", $c
end

echo "\n
end


document wchar_print
wchar_print <wstr>
Print ASCII part of <wstr>, which is a wide character string of type wchar_t*.
end

关于c++ - 在 linux 上调试时如何显示 Unicode 字符串?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1721545/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com