java - 剖析 Netty 性能-6ren

java - 剖析 Netty 性能

转载作者：IT王子更新时间：2023-10-29 00:24:15

25

4

我正在编写一个 Netty 应用程序。该应用程序运行在 64 位八核 linux 机器上

Netty 应用程序是一个简单的路由器，它接受请求(传入管道)，从请求中读取一些元数据并将数据转发到远程服务(传出管道)。

此远程服务将向传出管道返回一个或多个响应。 Netty 应用程序会将响应路由回原始客户端(传入管道)

将有成千上万的客户。将有数以千计的远程服务。

我正在进行一些小规模测试(10 个客户端，10 个远程服务)，但我没有看到我期望的 99.9 百分位数下的 10 毫秒以下性能。我正在测量客户端和服务器端的延迟。

我正在使用类似于 SPDY 的完全异步协议(protocol)。当我们处理 FrameDecoder 中的第一个字节时，我会捕获时间(我只使用 System.nanoTime())。我在调用 channel.write() 之前停止了计时器。我正在测量从传入管道到传出管道的亚毫秒时间(99.9 个百分点)，反之亦然。

我还测量了从 FrameDecoder 中的第一个字节到在(上面的)message.write() 上调用 ChannelFutureListener 回调的时间。时间高达几十毫秒(99.9 个百分点)，但我无法说服自己这是有用的数据。

我最初的想法是我们有一些速度慢的客户端。我观看了 channel.isWritable() 并在返回 false 时进行了记录。该方法正常情况下不返回false

一些事实:

我们正在使用 NIO 工厂。我们没有定制 worker 尺寸
我们已禁用 Nagel (tcpNoDelay=true)
我们启用了保持 Activity 状态 (keepAlive=true)
90% 以上的时间 CPU 处于空闲状态
网络空闲
GC (CMS) 在很短的时间内每 100 秒左右调用一次

是否有一种调试技术可以用来确定为什么我的 Netty 应用程序没有像我认为的那样快速运行？

感觉 channel.write() 将消息添加到队列中，而我们(使用 Netty 的应用程序开发人员)对这个队列没有透明度。不知道这个队列是Netty队列，OS队列，网卡队列还是什么。无论如何，我正在审查现有应用程序的示例，但我没有看到我遵循的任何反模式

感谢任何帮助/见解

最佳答案

Netty 默认创建 Runtime.getRuntime().availableProcessors() * 2 个 worker。在你的情况下是 16。这意味着您最多可以同时处理 16 个 channel ，其他 channel 将等到您释放 ChannelUpstreamHandler.handleUpstream/SimpleChannelHandler.messageReceived 处理程序，所以不要在这些 (IO) 线程中进行大量操作，否则您可能会卡住其他 channel 。

关于java - 剖析 Netty 性能，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/14613615/

25

4

0

文章推荐： C write() 在调用 close(fd) 之前不发送数据

文章推荐： linux - waitpid() 是做什么的？

django - 剖析 Django
我的 Django 应用程序在生产过程中变得非常缓慢。可能是由于某些复杂或未索引的查询。是否有任何类似 django 的方法来分析我的应用程序？最佳答案试试 Django Debug Toolb
javascript - GDownloadUrl 剖析
我正在使用GDownloadUrl将客户端数据发送到服务器。这里是我使用的sode GDownloadUrl( dwnld_url, function(data) {
python - 剖析 CherryPy
我一直在尝试开始分析我的 CherryPy 网络服务器，但文档缺乏关于如何设置它的详细信息。我知道我应该能够使用 cherrypy.lib.profiler 作为中间件来安装我的初始服务器。现在，我有
java - HashMap 剖析
是否有任何 HashMap 实现公开了用于分析 Map 性能的钩子(Hook)方法(平均链长度、最佳/最差/平均访问时间、#rehashes 等)。在 ~O(1) 访问时间方面使用 HashMap
c++ - 找到成本最高的方法并对其进行评估/剖析
我想知道是否有可用的技术或工具可以告诉您执行特定方法需要多少时间。类似于数学/计算机科学中的大 O 符号，可以让您了解算法的复杂性，我想知道代码分析是否有类似的东西。最佳答案 Profiling是
剖析 Ruby 访问控制
前面,我们说Ruby没有函数,只有方法.而且实际上有不止一种方法.这一节我们介绍访问控制(accesscontrols). 想想当我们在"最高层"而不是在一个类的定义里定义一个
vb6 - 剖析 COM 应用程序？
我有一个用 Visual Basic 编写的大型应用程序6，我需要分析它。有没有类似 ANTS Profiler 的东西但对于 COM应用程序？最佳答案我以前用 VBWatch .我对它有很好的体
clpfd - 剖析 ECLiPSe CLP？
我做了两个实现来解决 Shikaku 难题。一个使用顶部、左侧、宽度和高度 (TLWH) 作为每个矩形的参数，另一个使用顶部、左侧、底部、右侧 (TLBR)。出于某种原因，使用 TLBR 的速度要快
c++ - 剖析； ippvmGetLibVersion : I didn't call it
如果重要的话，我正在使用 Very Sleepy CS 进行分析。 IPP(Intel's Integrated Performance Primitives)在我的项目中使用，基本上是单次调用: i
python - 剖析 Python 中的置换算法
我想弄明白这个排列算法是如何工作的: def perm(n, i): if i == len(n) - 1: print n else: for j i
c++ - 剖析 C++ 代码编译速度
如果 C++ 项目的物理结构有利于编译速度，您将如何获得某种客观的衡量标准？有些人说你应该避免使用模板以获得更好的编译速度，但是如果模板生成大量非冗余目标代码，即使行/秒编译速度不是很好，那也不是很糟
c - 合并排序基本案例(递归)剖析
摘自 Robert Sedgewick 和 Kevin Wayne 算法第 4 版在递归部分基本情况代码是 if(end start) { mid = (start+end
c - 剖析 C 中的浮点用法
有没有一种简单的方法可以计算一段标准 C 代码实际执行的乘法次数？我想到的代码基本上只是做加法和乘法，主要兴趣是乘法，但也可以计算其他操作的数量。如果这是一个选项，我想我可以四处用“multiply
java - 剖析 Netty 性能
我正在编写一个 Netty 应用程序。该应用程序运行在 64 位八核 linux 机器上 Netty 应用程序是一个简单的路由器，它接受请求(传入管道)，从请求中读取一些元数据并将数据转发到远程服务(
Java Eclipse 剖析 Java 异常
我希望能得到一些帮助来弄清楚这个异常消息到底对我说了什么。我能够使用调试器将问题缩小到代码中的特定行。但是，我认为更多信息可以更好地找出代码中的实际问题。 public static List
mysql - 剖析 MySQL InnoDB 记录格式以从原始磁盘恢复
我有一个存储在 USB 拇指驱动器上的 mysql 数据库，该数据库已不可挽回地丢失了其文件分配表。因此，我无法访问整个 ibdata1 文件。不过，我可以找到使用十六进制编辑器使用的记录页面。所有
jquery - 剖析 img src 属性
我正在使用 jQuery 在单击时显示图像。通过将图像源存储到像这样的变量中，这可以很好地工作.. var theSrc = $(event.target).attr('src'); 然后我可以将这张
c - 剖析 C 代码 R
我是 R 的新手，但不是 C 的新手。我想看看是否可以为 friend 加速一个包。通常使用 C 我会编译一个设置了 -pg 标志的应用程序，然后将 gmon.out 文件传递给 gprof。我
c++ - VerySleepy 剖析 C++ 代码
在分析我的代码以找出运行缓慢的地方时，我有 3 个功能显然会永远占用，这就是非常困的说法。这些函数是: ZwDelayExecution 20.460813 20.460813 19.
java - 剖析 Java char[] 和字符串
我正在分析一个应用程序并注意到 52% (195MB) 的内存被 char[] 使用，20% 被 String 使用。这是一个有很多依赖项的大型项目，我刚刚看到它，所以我有几个相关的问题可以帮助我开始

首页

博学

6Ren·AI

商城

java - 剖析 Netty 性能