gpt4 book ai didi

c# - UTF8 byte[] 到字符串的转换

转载 作者:太空狗 更新时间:2023-10-29 21:32:42 25 4
gpt4 key购买 nike

我有无限大小的 UTF8 byte[](即非常大的大小)。我只想将其截断为 1024 字节,然后将其转换为字符串。

Encoding.UTF8.GetString(byte[], int, int) 为我做的。它首先缩短 1024 字节,然后给我它转换后的字符串。

但是在这个转换中,如果最后一个字符是 UTF8 字符集,它由 2 个字节组成,并且第一个字节在范围内,另一个字节超出范围,那么它会显示 ?转换后的字符串中的字符。

有什么方法可以让这个 ? 不出现在转换后的字符串中?

最佳答案

这就是 Decoder 类的用途。它允许您将 byte 数据流式传输到 char 数据中,同时保持足够的状态以正确处理部分代码点:

Encoding.UTF8.GetDecoder().GetChars(buffer, 0, 1024, charBuffer, 0)

当然,当代码点在中间分开时,Decoder 的状态会留下一个“partial char”,但这与您的情况无关(并且在所有其他用例中都是可取的:))。

关于c# - UTF8 byte[] 到字符串的转换,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36739025/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com