gpt4 book ai didi

c++ - 在不处理它的应用程序中使用 unicode/UTF8 处理/清理用户输入

转载 作者:塔克拉玛干 更新时间:2023-11-02 23:57:40 25 4
gpt4 key购买 nike

我在 Linux 中有一个不处理 unicode/UTF8 的控制台应用程序,我没有实现它的计划,因为除了这个问题之外没有必要。

用户在提示符中输入不包含 ascii 字符的命令,这导致了神秘的数据问题以及本应仅包含 ascii 字符的文本配置文件中的问题。

处理这个问题的最佳方法是什么?是否有一种不太复杂的方法可以将 unicode 字符串转换回 ascii 或删除任何无法使用 ascii 字符集的可见部分打印的字符?

Unicode 对我来说简直就是一场噩梦。

最佳答案

UTF-8 和许多单字节字符集是 ASCII 兼容的,0-127 之间的值表示正确的 ASCII 字符。(在 UTF-8 的情况下,具有多字节序列的字符的每个字节都超出此范围。)过滤掉其余部分可以解决您的问题。

尽管如此,您绝对应该改变态度并支持 UTF-8。

关于c++ - 在不处理它的应用程序中使用 unicode/UTF8 处理/清理用户输入,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14346792/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com