作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有 UTF-8 编码的文本文件。我可以按字符阅读。每个 char 可以是一个字节或多字节。我怎么知道在哪里读取了一个字节以及读取了多于一个字节?
最佳答案
在读取 char
时计算字节数。
对于每个 char c
:
if(c<128)
bytesCount++;
else if (c<2048)
bytesCount+=2;
else
bytesCount+=3;
另见编码定义 wikipedia URF8
关于java - 如何将字符位置转换为 UTF-8 文件中的字节位置?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14782968/
我是一名优秀的程序员,十分优秀!