11、Java并发编程：Java线程（中）：创建多少线程才是合适的？-6ren

11、Java并发编程：Java线程（中）：创建多少线程才是合适的？

转载作者：大佬之路更新时间：2024-01-31 14:12:33

要解决这个问题，首先要分析以下两个问题：

1、为什么要使用多线程？；
2、多线程的应用场景有哪些？；

为什么要使用多线程？

使用多线程，本质上就是提升程序性能。不过此刻谈到的性能，可能在你脑海里还是比较笼统的，基本上就是快、快、快，这种无法度量的感性认识很不科学，所以在提升性能之前，首要问题是：如何度量性能。

度量性能的指标有很多，但是有两个指标是最核心的，它们就是延迟和吞吐量。延迟指的是发出请求到收到响应这个过程的时间；延迟越短，意味着程序执行得越快，性能也就越好。 吞吐量指的是在单位时间内能处理请求的数量；吞吐量越大，意味着程序能处理的请求越多，性能也就越好。这两个指标内部有一定的联系（同等条件下，延迟越短，吞吐量越大），但是由于它们隶属不同的维度（一个是时间维度，一个是空间维度），并不能互相转换。

我们所谓提升性能，从度量的角度，主要是降低延迟，提高吞吐量。这也是我们使用多线程的主要目的。那我们该怎么降低延迟，提高吞吐量呢？这个就要从多线程的应用场景说起了。

多线程的应用场景

要想“降低延迟，提高吞吐量”，对应的方法呢，基本上有两个方向，一个方向是优化算法，另一个方向是将硬件的性能发挥到极致。前者属于算法范畴，后者则是和并发编程息息相关了。那计算机主要有哪些硬件呢？主要是两类：一个是 I/O，一个是 CPU。简言之，在并发编程领域，提升性能本质上就是提升硬件的利用率，再具体点来说，就是提升 I/O 的利用率和 CPU 的利用率。

估计这个时候你会有个疑问，操作系统不是已经解决了硬件的利用率问题了吗？的确是这样，例如操作系统已经解决了磁盘和网卡的利用率问题，利用中断机制还能避免 CPU 轮询 I/O 状态，也提升了 CPU 的利用率。但是操作系统解决硬件利用率问题的对象往往是单一的硬件设备，而我们的并发程序，往往需要 CPU 和 I/O 设备相互配合工作，也就是说，我们需要解决 CPU 和 I/O 设备综合利用率的问题。关于这个综合利用率的问题，操作系统虽然没有办法完美解决，但是却给我们提供了方案，那就是：多线程。

下面我们用一个简单的示例来说明：如何利用多线程来提升 CPU 和 I/O 设备的利用率？假设程序按照 CPU 计算和 I/O 操作交叉执行的方式运行，而且 CPU 计算和 I/O 操作的耗时是 1:1。

如下图所示，如果只有一个线程，执行 CPU 计算的时候，I/O 设备空闲；执行 I/O 操作的时候，CPU 空闲，所以 CPU 的利用率和 I/O 设备的利用率都是 50%。

如果有两个线程，如下图所示，当线程 A 执行 CPU 计算的时候，线程 B 执行 I/O 操作；当线程 A 执行 I/O 操作的时候，线程 B 执行 CPU 计算，这样 CPU 的利用率和 I/O 设备的利用率就都达到了 100%。

我们将CPU 的利用率和 I/O 设备的利用率都提升到了 100%，会对性能产生了哪些影响呢？通过上面的图示，很容易看出：单位时间处理的请求数量翻了一番，也就是说吞吐量提高了 1 倍。此时可以逆向思维一下，如果 CPU 和 I/O 设备的利用率都很低，那么可以尝试通过增加线程来提高吞吐量。

在单核时代，多线程主要就是用来平衡 CPU 和 I/O 设备的。如果程序只有 CPU 计算，而没有 I/O 操作的话，多线程不但不会提升性能，还会使性能变得更差，原因是增加了线程切换的成本。但是在多核时代，这种纯计算型的程序也可以利用多线程来提升性能。为什么呢？因为利用多核可以降低响应时间。

为便于你理解，这里我举个简单的例子说明一下：计算 1+2+… … +100 亿的值，如果在 4 核的 CPU 上利用 4 个线程执行，线程 A 计算 [1，25 亿)，线程 B 计算 [25 亿，50 亿)，线程 C 计算 [50，75 亿)，线程 D 计算 [75 亿，100 亿]，之后汇总，那么理论上应该比一个线程计算 [1，100 亿] 快将近 4 倍，响应时间能够降到 25%。一个线程，对于 4 核的 CPU，CPU 的利用率只有 25%，而 4 个线程，则能够将 CPU 的利用率提高到 100%。

创建多少线程合适？

创建多少线程合适，要看多线程具体的应用场景。我们的程序一般都是 CPU 计算和 I/O 操作交叉执行的，由于 I/O 设备的速度相对于 CPU 来说都很慢，所以大部分情况下，I/O 操作执行的时间相对于 CPU 计算来说都非常长，这种场景我们一般都称为 I/O 密集型计算；和 I/O 密集型计算相对的就是 CPU 密集型计算了，CPU 密集型计算大部分场景下都是纯 CPU 计算。I/O 密集型程序和 CPU 密集型程序，计算最佳线程数的方法是不同的。

下面我们对这两个场景分别说明。

对于CPU 密集型计算，多线程本质上是提升多核 CPU 的利用率，所以对于一个 4 核的 CPU，每个核一个线程，理论上创建 4 个线程就可以了，再多创建线程也只是增加线程切换的成本。所以，对于 CPU 密集型的计算场景，理论上“线程的数量 =CPU 核数”就是最合适的。不过在工程上，线程的数量一般会设置为“CPU 核数 +1”，这样的话，当线程因为偶尔的内存页失效或其他原因导致阻塞时，这个额外的线程可以顶上，从而保证 CPU 的利用率。

对于I/O 密集型的计算场景，比如前面我们的例子中，如果 CPU 计算和 I/O 操作的耗时是 1:1，那么 2 个线程是最合适的。如果 CPU 计算和 I/O 操作的耗时是 1:2，那多少个线程合适呢？是 3 个线程，如下图所示：CPU 在 A、B、C 三个线程之间切换，对于线程 A，当 CPU 从 B、C 切换回来时，线程 A 正好执行完 I/O 操作。这样 CPU 和 I/O 设备的利用率都达到了 100%。

通过上面这个例子，我们会发现，对于 I/O 密集型计算场景，最佳的线程数是与程序中 CPU 计算和 I/O 操作的耗时比相关的，我们可以总结出这样一个公式：

最佳线程数 =1 +（I/O 耗时 / CPU 耗时）

我们令R=I/O 耗时 / CPU 耗时，综合上图，可以这样理解：当线程 A 执行 IO 操作时，另外 R 个线程正好执行完各自的 CPU 计算。这样 CPU 的利用率就达到了 100%。

不过上面这个公式是针对单核 CPU 的，至于多核 CPU，也很简单，只需要等比扩大就可以了，计算公式如下：

最佳线程数 =CPU 核数 * [ 1 +（I/O 耗时 / CPU 耗时）]

总结

很多人都知道线程数不是越多越好，但是设置多少是合适的，却又拿不定主意。其实只要把握住一条原则就可以了，这条原则就是将硬件的性能发挥到极致。上面我们针对 CPU 密集型和 I/O 密集型计算场景都给出了理论上的最佳公式，这些公式背后的目标其实就是将硬件的性能发挥到极致。

对于I/O 密集型计算场景，I/O 耗时和 CPU 耗时的比值是一个关键参数，不幸的是这个参数是未知的，而且是动态变化的，所以工程上，我们要估算这个参数，然后做各种不同场景下的压测来验证我们的估计。不过工程上，原则还是将硬件的性能发挥到极致，所以压测时，我们需要重点关注 CPU、I/O 设备的利用率和性能指标（响应时间、吞吐量）之间的关系。

文章推荐： 04、Java并发编程：线程间定制化通信

文章推荐： 12、Java并发编程：CompletableFuture异步回调

文章推荐： 02、Java并发编程：Lock接口

文章推荐： 09、Java并发编程：阻塞队列 BlockingQueue

ios - 什么时候使用presentedViewController 合适？
假设我正在使用 segues 转换 View Controller 。我在 View Controller 1 上有一个 textField，在第二个 View Controller 上有一个标签。当
sql - 为什么我们在进行事务时需要回滚命令或告诉我什么时候使用 "ROLLBACK"合适
在下面的代码中，当我在表中插入数据时，回滚的目的是什么，如果我想回滚，我不应该插入它，那么使用回滚的合适方法是什么？ BEGIN TRANSACTION Insert into dimCustomr
scala - 什么时候使用 TrieMap 合适？
我一直在阅读一些帖子，并想知道是否有人可以介绍 TrieMap 何时比使用 HashMap 更可取的情况。那么本质上是什么架构决策应该激励使用 TrieMap？最佳答案根据文档。它是可以在多线
language-agnostic - 什么时候使用 do-while 合适？
什么时候 do-while 比其他类型的循环更好？有哪些常见场景比其他场景更好？我了解 do-while 的功能，但不了解何时使用它。最佳答案当您需要至少完成一次某事，但不知道启动循环之前的次数
cocoa - 什么时候调用 fileExistsAtPath 合适？
fileExistsAtPath 的文档如下: Attempting to predicate behavior based on the current state of the file syst
ios - 什么时候发布 CGImageRef 合适？
当 XCode 分析我的代码时，它发现了潜在的内存泄漏。我使用 ARC，但我了解到 ARC 不处理 C 类型。因为我使用 CGImageRef 来创建 UIImage 并分配给 UIImageView
c# - 什么时候使用 CacheItemRemovedCallback 合适？
我有一个每天更新一次的大型数据集。我正在缓存对该数据进行昂贵查询的结果，但我想每天更新该缓存。我正在考虑使用 CacheItemRemovedCallback 每天重新加载我的缓存，但我有以下问题:
inversion-of-control - 什么时候使用 IoC 合适？
我了解 IoC 容器是什么，并且一直在阅读结构图。该技术似乎很容易使用。我的问题是，使用 IoC 容器的适当粒度级别是多少？我看到以下可能的 IoC 应用级别: 打破所有对象之间的所有依赖关系——当
Java:存储数据库中的信息。哪些 Collection 合适？
我用 Java 编写了一个应用程序。我从数据库中获取一个表(客户端)，其中包含以下字段: 名称 |姓氏 |地址在我的应用中存储这些数据的最佳解决方案是什么？我应该为每个客户端创建一个对象并将这些对象
javascript - 什么时候用 this 代替 prototype 合适？
这个问题在这里已经有了答案: Use of 'prototype' vs. 'this' in JavaScript? (16 个答案) 关闭 8 年前。 function A() { this
python - 什么时候调用 loop.close() 合适？
我已经试验了一段时间 asyncio 并阅读了 PEPs ；一些教程；甚至是 O'Reilly book 。我想我已经掌握了窍门，但我仍然对 loop.close() 的行为感到困惑，我不太清楚何时
c++ - 使用 DialogBox 作为主窗口是否正确/合适？
它是否正确，因为在 Windows 中并没有说它不好或不推荐。例如像这样: int APIENTRY _tWinMain(HINSTANCE hInstance,
.htaccess 重定向 - 更新站点(301 合适？)
我在更新我的网站时遇到问题，谷歌搜索结果显示指向旧页面的链接，这些链接现在是 404，其中一些甚至包含已弃用的内容。我的问题是关于 301 的使用。旧页面具有深层嵌套页面，如下例所示: ww
java - 什么时候调用 robot.cleanUp() 合适
我使用 JUnit 和 FEST 对我们的应用程序进行 Swing 集成测试，我在测试用例中多次启动和停止。 @after 是否应该包含对 robot.cleanUp() 的调用？最佳答案一般规则
c# - 什么时候使用 C# 类库 (.dll) 合适？
我是一名从未真正使用过 .dll 文件的程序员。当然，当我需要第 3 方软件时，例如图形库、帮助我创建图形的库等。我会将引用/ddl 文件添加到我的程序中并在我的代码中使用它们。此外，您似乎可以将
networking - 什么时候使用 UDP 而不是 TCP 合适？
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。这个问题似乎不是关于 a specific programming problem, a softwar
kotlin - 如何使 "inappropriate blocking method call"合适？
我目前正在尝试更多地利用 kotlin 协程。但我面临一个问题:在这些协程中使用 moshi 或 okhttp 时，我收到警告: “不适当的阻塞方法调用” 解决这些问题的最佳方法是什么？我真的不想不合
asp.net-mvc - 什么时候使用 Html.RenderAction() 合适？
我有点不确定什么时候适合使用 Html.RenderAction() 来渲染我的 View ，什么时候不适合。我的理解是，因为它不是 ASP.NET MVC 的“官方”组件，所以使用它是不好的做法，它
asp.net-mvc - 什么时候使用 ViewData 而不是 ViewModels 合适？
假设你想开发你的 Controller ，以便你使用 ViewModel 来包含你渲染的 View 的数据，所有数据都应该包含在 ViewModel 中吗？什么条件下可以绕过 ViewModel？我
.net - 什么时候说 : "Now I need to create a user control!" 合适
您何时考虑在 .NET 中创建用户控件？您是否有一些基本标准来从页面中排除您的代码并引入新的用户控件？通常我倾向于遵循这些来决定我是否需要用户控件: 当使用单独的用户控件使页面看起来更具可读性时当

大佬之路

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城