gpt4 book ai didi

java - 如何将字符位置转换为 UTF-8 文件中的字节位置?

转载 作者:行者123 更新时间:2023-11-29 09:06:22 27 4
gpt4 key购买 nike

我有 UTF-8 编码的文本文件。我可以按字符阅读。每个 char 可以是一个字节或多字节。我怎么知道在哪里读取了一个字节以及读取了多于一个字节?

最佳答案

在读取 char 时计算字节数。

对于每个 char c:

if(c<128)
bytesCount++;
else if (c<2048)
bytesCount+=2;
else
bytesCount+=3;

另见编码定义 wikipedia URF8

关于java - 如何将字符位置转换为 UTF-8 文件中的字节位置?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14782968/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com