- Java锁的逻辑(结合对象头和ObjectMonitor)
- 还在用饼状图?来瞧瞧这些炫酷的百分比可视化新图形(附代码实现)⛵
- 自动注册实体类到EntityFrameworkCore上下文,并适配ABP及ABPVNext
- 基于Sklearn机器学习代码实战
本文已收录到 AndroidFamily ,技术和职场问题,请关注公众号 [彭旭锐] 提问.
大家好,我是小彭.
今天,我们来讨论一个 Square 开源的 I/O 框架 Okio,我们最开始接触到 Okio 框架还是源于 Square 家的 OkHttp 网络框架。那么,OkHttp 为什么要使用 Okio,它相比于 Java 原生 IO 有什么区别和优势?今天我们就围绕这些问题展开.
本文源码基于 Okio v3.2.0.
思维导图 。
相比于 Java 原生 IO 框架,我认为 Okio 的优势主要体现在 3 个方面:
1、精简且全面的 API: 原生 IO 使用装饰模式,例如使用 BufferedInputStream 装饰 FileInputStream 文件输入流,可以增强流的缓冲功能。但是原生 IO 的装饰器过于庞大,需要区分字节、字符流、字节数组、字符数组、缓冲等多种装饰器,而这些恰恰又是最常用的基础装饰器。相较之下,Okio 直接在 BufferedSource 和 BufferedSink 中聚合了原生 IO 中所有基础的装饰器,使得框架更加精简; 。
2、基于共享的缓冲区设计: 由于 IO 系统调用存在上下文切换的性能损耗,为了减少系统调用次数,应用层往往会采用缓冲区策略。但是缓冲区又会存在副作用,当数据从一个缓冲区转移到另一个缓冲区时需要拷贝数据,这种内存中的拷贝显得没有必要。而 Okio 采用了基于共享的缓冲区设计,在缓冲区间转移数据只是共享 Segment 的引用,而减少了内存拷贝。同时 Segment 也采用了对象池设计,减少了内存分配和回收的开销; 。
3、超时机制: Okio 弥补了部分 IO 操作不支持超时检测的缺陷,而且 Okio 不仅支持单次 IO 操作的超时检测,还支持包含多次 IO 操作的复合任务超时检测.
下面,我们将从这三个优势展开分析:
先用一个表格总结 Okio 框架中主要的类型:
类型 | 描述 |
---|---|
Source | 输入流 |
Sink | 输出流 |
BufferedSource | 缓存输入流接口,实现类是 RealBufferedSource |
BufferedSink | 缓冲输出流接口,实现类是 RealBufferedSink |
Buffer | 缓冲区,由 Segment 链表组成 |
Segment | 数据片段,多个片段组成逻辑上连续数据 |
ByteString | String 类 |
Timeout | 超时控制 |
在 Java 原生 IO 中有四个基础接口,分别是:
InputStream
输入流和 OutputStream
输出流; Reader
输入流和 Writer
输出流。 而在 Okio 更加精简,只有两个基础接口,分别是:
Source
输入流和 Sink
输出流。 Source.kt 。
interface Source : Closeable {
// 从输入流读取数据到 Buffer 中(Buffer 等价于 byte[] 字节数组)
// 返回值:-1:输入内容结束
@Throws(IOException::class)
fun read(sink: Buffer, byteCount: Long): Long
// 超时控制(详细分析见后续文章)
fun timeout(): Timeout
// 关闭流
@Throws(IOException::class)
override fun close()
}
Sink.java 。
actual interface Sink : Closeable, Flushable {
// 将 Buffer 的数据写入到输出流中(Buffer 等价于 byte[] 字节数组)
@Throws(IOException::class)
actual fun write(source: Buffer, byteCount: Long)
// 清空输出缓冲区
@Throws(IOException::class)
actual override fun flush()
// 超时控制(详细分析见后续文章)
actual fun timeout(): Timeout
// 关闭流
@Throws(IOException::class)
actual override fun close()
}
在功能上,InputStream - Source 和 OutputStream - Sink 分别是等价的,而且是相互兼容的。结合 Kotlin 扩展函数,两种接口之间的转换会非常方便:
比较不理解的是: Okio 没有提供 InputStreamSource 和 OutputStreamSink 转回 InputStream 和 OutputStream 的方法,而是需要先转换为 BufferSource 与 BufferSink,再转回 InputStream 和 OutputStream.
示例代码 。
// 原生 IO -> Okio
val source = FileInputStream(File("")).source()
val bufferSource = FileInputStream(File("")).source().buffer()
val sink = FileOutputStream(File("")).sink()
val bufferSink = FileOutputStream(File("")).sink().buffer()
// Okio -> 原生 IO
val inputStream = bufferSource.inputStream()
val outputStream = bufferSink.outputStream()
JvmOkio.kt 。
// InputStream -> Source
fun InputStream.source(): Source = InputStreamSource(this, Timeout())
// OutputStream -> Sink
fun OutputStream.sink(): Sink = OutputStreamSink(this, Timeout())
private class InputStreamSource(
private val input: InputStream,
private val timeout: Timeout
) : Source {
override fun read(sink: Buffer, byteCount: Long): Long {
if (byteCount == 0L) return 0
require(byteCount >= 0) { "byteCount < 0: $byteCount" }
try {
// 同步超时监控(详细分析见后续文章)
timeout.throwIfReached()
// 读入 Buffer
val tail = sink.writableSegment(1)
val maxToCopy = minOf(byteCount, Segment.SIZE - tail.limit).toInt()
val bytesRead = input.read(tail.data, tail.limit, maxToCopy)
if (bytesRead == -1) {
if (tail.pos == tail.limit) {
// We allocated a tail segment, but didn't end up needing it. Recycle!
sink.head = tail.pop()
SegmentPool.recycle(tail)
}
return -1
}
tail.limit += bytesRead
sink.size += bytesRead
return bytesRead.toLong()
} catch (e: AssertionError) {
if (e.isAndroidGetsocknameError) throw IOException(e)
throw e
}
}
override fun close() = input.close()
override fun timeout() = timeout
override fun toString() = "source($input)"
}
private class OutputStreamSink(
private val out: OutputStream,
private val timeout: Timeout
) : Sink {
override fun write(source: Buffer, byteCount: Long) {
checkOffsetAndCount(source.size, 0, byteCount)
var remaining = byteCount
// 写出 Buffer
while (remaining > 0) {
// 同步超时监控(详细分析见后续文章)
timeout.throwIfReached()
// 取有效数据量和剩余输出量的较小值
val head = source.head!!
val toCopy = minOf(remaining, head.limit - head.pos).toInt()
out.write(head.data, head.pos, toCopy)
head.pos += toCopy
remaining -= toCopy
source.size -= toCopy
// 指向下一个 Segment
if (head.pos == head.limit) {
source.head = head.pop()
SegmentPool.recycle(head)
}
}
}
override fun flush() = out.flush()
override fun close() = out.close()
override fun timeout() = timeout
override fun toString() = "sink($out)"
}
Okio.kt 。
// Source -> BufferedSource
fun Source.buffer(): BufferedSource = RealBufferedSource(this)
// Sink -> BufferedSink
fun Sink.buffer(): BufferedSink = RealBufferedSink(this)
在 Java 原生 IO 中,为了减少系统调用次数,我们一般不会直接调用 InputStream 和 OutputStream,而是会使用 BufferedInputStream 和 BufferedOutputStream 包装类增加缓冲功能.
例如,我们希望采用带缓冲的方式读取字符格式的文件,则需要先将文件输入流包装为字符流,再包装为缓冲流:
Java 原生 IO 示例 。
// 第一层包装
FileInputStream fis = new FileInputStream(file);
// 第二层包装
InputStreamReader isr = new InputStreamReader(new FileInputStream(file), "UTF-8");
// 第三层包装
BufferedReader br = new BufferedReader(isr);
String line;
while ((line = br.readLine()) != null) {
...
}
// 省略 close
同理,我们在 Okio 中一般也不会直接调用 Source 和 Sink,而是会使用 BufferedSource 和 BufferedSink 包装类增加缓冲功能:
Okio 示例 。
val bufferedSource = file.source()/*第一层包装*/.buffer()/*第二层包装*/
while (!bufferedSource.exhausted()) {
val line = bufferedSource.readUtf8Line();
...
}
// 省略 close
网上有资料说 Okio 没有使用装饰器模式,所以类结构更简单。 这么说其实不太准确,装饰器模式本身并不是缺点,而且从 BufferedSource 和 BufferSink 可以看出 Okio 也使用了装饰器模式。 严格来说是原生 IO 的装饰器过于庞大,而 Okio 的装饰器更加精简.
比如原生 IO 常用的流就有这么多:
原始流: FileInputStream / FileOutputStream 与 SocketInputStream / SocketOutputStream; 。
基础接口(区分字节流和字符流): InputStream / OutputStream 与 Reader / Writer; 。
缓存流: BufferedInputStream / BufferedOutputStream 与 BufferedReader / BufferedWriter; 。
基本类型: DataInputStream / DataOutputStream; 。
字节数组和字符数组: ByteArrayInputStream / ByteArrayOutputStream 与 CharArrayReader / CharArrayWriter; 。
此处省略一万个字.
原生 IO 框架 。
而这么多种流在 Okio 里还剩下多少呢?
Okio 框架 。
就问你服不服?
而且你看哈,这些都是平时业务开发中最常见的基本类型,原生 IO 把它们都拆分开了,让问题复杂化了。反观 Okio 直接在 BufferedSource 和 BufferedSink 中聚合了原生 IO 中基本的功能,而不再需要区分字节、字符、字节数组、字符数组、基础类型等等装饰器,确实让框架更加精简.
BufferedSource.kt 。
actual interface BufferedSource : Source, ReadableByteChannel {
actual val buffer: Buffer
// 读取 Int
@Throws(IOException::class)
actual fun readInt(): Int
// 读取 String
@Throws(IOException::class)
fun readString(charset: Charset): String
...
fun inputStream(): InputStream
}
BufferedSink.kt 。
actual interface BufferedSink : Sink, WritableByteChannel {
actual val buffer: Buffer
// 写入 Int
@Throws(IOException::class)
actual fun writeInt(i: Int): BufferedSink
// 写入 String
@Throws(IOException::class)
fun writeString(string: String, charset: Charset): BufferedSink
...
fun outputStream(): OutputStream
}
BufferedSource 和 BufferedSink 还是接口,它们的真正的实现类是 RealBufferedSource 和 RealBufferedSink。可以看到,在实现类中会创建一个 Buffer 缓冲区,在输入和输出的时候,都会借助 “Buffer 缓冲区” 减少系统调用次数.
RealBufferedSource.kt 。
internal actual class RealBufferedSource actual constructor(
// 装饰器模式
@JvmField actual val source: Source
) : BufferedSource {
// 创建输入缓冲区
@JvmField val bufferField = Buffer()
// 带缓冲地读取(全部数据)
override fun readString(charset: Charset): String {
buffer.writeAll(source)
return buffer.readString(charset)
}
// 带缓冲地读取(byteCount)
override fun readString(byteCount: Long, charset: Charset): String {
require(byteCount)
return buffer.readString(byteCount, charset)
}
}
RealBufferedSink.kt 。
internal actual class RealBufferedSink actual constructor(
// 装饰器模式
@JvmField actual val sink: Sink
) : BufferedSink {
// 创建输出缓冲区
@JvmField val bufferField = Buffer()
// 带缓冲地写入(全部数据)
override fun writeString(string: String, charset: Charset): BufferedSink {
buffer.writeString(string, charset)
return emitCompleteSegments()
}
// 带缓冲地写入(beginIndex - endIndex)
override fun writeString(
string: String,
beginIndex: Int,
endIndex: Int,
charset: Charset
): BufferedSink {
buffer.writeString(string, beginIndex, endIndex, charset)
return emitCompleteSegments()
}
}
至此,Okio 基本框架分析结束,用一张图总结:
Okio 框架 。
在操作系统中,访问磁盘和网卡等 IO 操作需要通过系统调用来执行。系统调用本质上是一种软中断,进程会从用户态陷入内核态执行中断处理程序,完成 IO 操作后再从内核态切换回用户态.
可以看到,系统调用存在上下文切换的性能损耗。为了减少系统调用次数,应用层往往会采用缓冲区策略:
以 Java 原生 IO BufferedInputStream 为例,会通过一个 byte[] 数组作为数据源的输入缓冲,每次读取数据时会读取更多数据到缓冲区中:
输出流 BufferedOutputStream 也类似,输出数据时会优先写到缓冲区,当缓冲区满或者手动调用 flush() 时,再执行系统调用写出数据.
伪代码 。
// 1. 输入
fun read(byte[] dst, int len) : Int {
// 缓冲区有效数据量
int avail = count - pos
if(avail <= 0) {
if(len >= 缓冲区容量) {
// 直接从输入流读取
read(输入流 in, dst, len)
}
// 填充缓冲区
fill(数据源 in, 缓冲区)
}
// 本次读取数据量,不超过可用容量
int cnt = (avail < len) ? avail : len?
read(缓冲区, dst, cnt)
// 更新缓冲区索引
pos += cnt
return cnt
}
// 2. 输出
fun write(byte[] src, len) {
if(len > 缓冲区容量) {
// 先将缓冲区写出
flush(缓冲区)
// 直接写出数据
write(输出流 out, src, len)
}
// 缓冲区剩余容量
int left = 缓冲区容量 - count
if(len > 缓冲区剩余容量) {
// 先将缓冲区写出
flush(缓冲区)
}
// 将数据写入缓冲区
write(缓冲区, src, len)
// 更新缓冲区已添加数据容量
count += len
}
的确,缓冲区策略能有效地减少系统调用次数,不至于读取一个字节都需要执行一次系统调用,大多数情况下表现良好。 但考虑一种 “双流操作” 场景,即从一个输入流读取,再写入到一个输出流。回顾刚才讲的缓存策略,此时的数据转移过程为:
如果这两个流都使用了缓冲区设计,那么数据在这两个内存缓冲区之间相互拷贝,就显得没有必要.
Okio 当然也有缓冲区策略,如果没有就会存在频繁系统调用的问题.
Buffer 是 RealBufferedSource 和 RealBufferedSink 的数据缓冲区。虽然在实现上与原生 BufferedInputStream 和 BufferedOutputStream 不一样,但在功能上是一样的。区别在于:
1、BufferedInputStream 中的缓冲区是 “一个固定长度的字节数组” ,数据从一个缓冲区转移到另一个缓冲区需要拷贝; 。
2、Buffer 中的缓冲区是 “一个 Segment 双向循环链表” ,每个 Segment 对象是一小段字节数组,依靠 Segment 链表的顺序组成逻辑上的连续数据。这个 Segment 片段是 Okio 高效的关键.
Buffer.kt 。
actual class Buffer : BufferedSource, BufferedSink, Cloneable, ByteChannel {
// 缓冲区(Segment 双向链表)
@JvmField internal actual var head: Segment? = null
// 缓冲区数据量
@get:JvmName("size")
actual var size: Long = 0L
internal set
override fun buffer() = this
actual override val buffer get() = this
}
对比 BufferedInputStream:
BufferedInputStream.java 。
public class BufferedInputStream extends FilterInputStream {
// 缓冲区的默认大小(8KB)
private static int DEFAULT_BUFFER_SIZE = 8192;
// 输入缓冲区(固定长度的数组)
protected volatile byte buf[];
// 有效数据起始位,也是读数据的起始位
protected int pos;
// 有效数据量,pos + count 是写数据的起始位
protected int count;
...
}
Segment 中的字节数组是可以 “共享” 的,当数据从一个缓冲区转移到另一个缓冲区时,可以共享数据引用,而不一定需要拷贝数据.
Segment.kt 。
internal class Segment {
companion object {
// 片段的默认大小(8KB)
const val SIZE = 8192
// 最小共享阈值,超过 1KB 的数据才会共享
const val SHARE_MINIMUM = 1024
}
// 底层数组
@JvmField val data: ByteArra
// 有效数据的起始位,也是读数据的起始位
@JvmField var pos: Int = 0
// 有效数据的结束位,也是写数据的起始位
@JvmField var limit: Int = 0
// 共享标记位
@JvmField var shared: Boolean = false
// 宿主标记位
@JvmField var owner: Boolean = false
// 后续指针
@JvmField var next: Segment? = null
// 前驱指针
@JvmField var prev: Segment? = null
constructor() {
// 默认构造 8KB 数组(为什么默认长度是 8KB)
this.data = ByteArray(SIZE)
// 宿主标记位
this.owner = true
// 共享标记位
this.shared = false
}
}
另外,Segment 还使用了对象池设计,被回收的 Segment 对象会缓存在 SegmentPool 中。SegmentPool 内部维护了一个被回收的 Segment 对象单链表,缓存容量的最大值是 MAX_SIZE = 64 * 1024 ,也就相当于 8 个默认 Segment 的长度:
SegmentPool.kt 。
// object:全局单例
internal actual object SegmentPool {
// 缓存容量
actual val MAX_SIZE = 64 * 1024
// 头节点
private val LOCK = Segment(ByteArray(0), pos = 0, limit = 0, shared = false, owner = false)
...
}
Segment 示意图 。
关于 Okio 超时机制的详细分析,我们在 下一篇文章 里讨论。请关注.
最后此篇关于AndroidIO框架Okio的实现原理,到底哪里OK?的文章就讲到这里了,如果你想了解更多关于AndroidIO框架Okio的实现原理,到底哪里OK?的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。
背景: 我最近一直在使用 JPA,我为相当大的关系数据库项目生成持久层的轻松程度给我留下了深刻的印象。 我们公司使用大量非 SQL 数据库,特别是面向列的数据库。我对可能对这些数据库使用 JPA 有一
我已经在我的 maven pom 中添加了这些构建配置,因为我希望将 Apache Solr 依赖项与 Jar 捆绑在一起。否则我得到了 SolarServerException: ClassNotF
interface ITurtle { void Fight(); void EatPizza(); } interface ILeonardo : ITurtle {
我希望可用于 Java 的对象/关系映射 (ORM) 工具之一能够满足这些要求: 使用 JPA 或 native SQL 查询获取大量行并将其作为实体对象返回。 允许在行(实体)中进行迭代,并在对当前
好像没有,因为我有实现From for 的代码, 我可以转换 A到 B与 .into() , 但同样的事情不适用于 Vec .into()一个Vec . 要么我搞砸了阻止实现派生的事情,要么这不应该发
在 C# 中,如果 A 实现 IX 并且 B 继承自 A ,是否必然遵循 B 实现 IX?如果是,是因为 LSP 吗?之间有什么区别吗: 1. Interface IX; Class A : IX;
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the
我正在阅读标准haskell库的(^)的实现代码: (^) :: (Num a, Integral b) => a -> b -> a x0 ^ y0 | y0 a -> b ->a expo x0
我将把国际象棋游戏表示为 C++ 结构。我认为,最好的选择是树结构(因为在每个深度我们都有几个可能的移动)。 这是一个好的方法吗? struct TreeElement{ SomeMoveType
我正在为用户名数据库实现字符串匹配算法。我的方法采用现有的用户名数据库和用户想要的新用户名,然后检查用户名是否已被占用。如果采用该方法,则该方法应该返回带有数据库中未采用的数字的用户名。 例子: “贾
我正在尝试实现 Breadth-first search algorithm , 为了找到两个顶点之间的最短距离。我开发了一个 Queue 对象来保存和检索对象,并且我有一个二维数组来保存两个给定顶点
我目前正在 ika 中开发我的 Python 游戏,它使用 python 2.5 我决定为 AI 使用 A* 寻路。然而,我发现它对我的需要来说太慢了(3-4 个敌人可能会落后于游戏,但我想供应 4-
我正在寻找 Kademlia 的开源实现C/C++ 中的分布式哈希表。它必须是轻量级和跨平台的(win/linux/mac)。 它必须能够将信息发布到 DHT 并检索它。 最佳答案 OpenDHT是
我在一本书中读到这一行:-“当我们要求 C++ 实现运行程序时,它会通过调用此函数来实现。” 而且我想知道“C++ 实现”是什么意思或具体是什么。帮忙!? 最佳答案 “C++ 实现”是指编译器加上链接
我正在尝试使用分支定界的 C++ 实现这个背包问题。此网站上有一个 Java 版本:Implementing branch and bound for knapsack 我试图让我的 C++ 版本打印
在很多情况下,我需要在 C# 中访问合适的哈希算法,从重写 GetHashCode 到对数据执行快速比较/查找。 我发现 FNV 哈希是一种非常简单/好/快速的哈希算法。但是,我从未见过 C# 实现的
目录 LRU缓存替换策略 核心思想 不适用场景 算法基本实现 算法优化
1. 绪论 在前面文章中提到 空间直角坐标系相互转换 ,测绘坐标转换时,一般涉及到的情况是:两个直角坐标系的小角度转换。这个就是我们经常在测绘数据处理中,WGS-84坐标系、54北京坐标系
在软件开发过程中,有时候我们需要定时地检查数据库中的数据,并在发现新增数据时触发一个动作。为了实现这个需求,我们在 .Net 7 下进行一次简单的演示. PeriodicTimer .
二分查找 二分查找算法,说白了就是在有序的数组里面给予一个存在数组里面的值key,然后将其先和数组中间的比较,如果key大于中间值,进行下一次mid后面的比较,直到找到相等的,就可以得到它的位置。
我是一名优秀的程序员,十分优秀!