- r - 以节省内存的方式增长 data.frame
- ruby-on-rails - ruby/ruby on rails 内存泄漏检测
- android - 无法解析导入android.support.v7.app
- UNIX 域套接字与共享内存(映射文件)
我最近在运行一些比较网络性能与环回性能的性能测试时偶然发现了一个有趣的 TCP 性能问题。在我的例子中,网络性能超过了环回性能(1Gig 网络,相同的子网)。在我处理延迟的情况下,延迟是至关重要的,因此启用了 TCP_NODELAY。我们提出的最佳理论是 TCP 拥塞控制正在阻止数据包。我们做了一些数据包分析,我们可以肯定地看到数据包被保留,但原因并不明显。现在的问题...
1) 在什么情况下,为什么通过环回进行通信会比通过网络进行通信慢?
2) 在尽可能快地发送时,为什么切换 TCP_NODELAY 对通过环回的最大吞吐量的影响比通过网络的影响大得多?
3) 我们如何检测和分析 TCP 拥塞控制作为性能不佳的潜在解释?
4) 有没有人对这种现象的原因有任何其他理论?如果是,有什么方法可以证明这个理论?
这是一个简单的点对点 C++ 应用程序生成的一些示例数据:
Transport Message Size (bytes) TCP NoDelay Send Buffer (bytes) Sender Host Receiver Host Throughput (bytes/sec) Message Rate (msgs/sec)TCP 128 On 16777216 HostA HostB 118085994 922546TCP 128 Off 16777216 HostA HostB 118072006 922437TCP 128 On 4096 HostA HostB 11097417 86698TCP 128 Off 4096 HostA HostB 62441935 487827TCP 128 On 16777216 HostA HostA 20606417 160987TCP 128 Off 16777216 HostA HostA 239580949 1871726TCP 128 On 4096 HostA HostA 18053364 141041TCP 128 Off 4096 HostA HostA 214148304 1673033UnixStream 128 - 16777216 HostA HostA 89215454 696995UnixDatagram 128 - 16777216 HostA HostA 41275468 322464NamedPipe 128 - - HostA HostA 73488749 574130
这里还有一些有用的信息:
谢谢
最佳答案
1) 在什么情况下,为什么通过环回通信会比通过网络慢?
Loopback 将 tx+rx 的数据包设置+tcp chksum 计算放在同一台机器上,因此它需要进行 2 倍的处理,而对于 2 台机器,您可以在它们之间拆分 tx/rx。这会对环回产生负面影响。
2) 在尽可能快地发送时,为什么切换 TCP_NODELAY 对通过环回的最大吞吐量的影响比通过网络的影响大得多?
不确定您是如何得出这个结论的,但是环回与网络的实现方式非常不同,如果您尝试将它们推到极限,您会遇到不同的问题。环回接口(interface)(如对 1 的回答中所述)会导致同一台机器上的 tx+rx 处理开销。另一方面,NIC 在循环缓冲区中可以有多少未完成的数据包等方面有# of limits,这将导致完全不同的瓶颈(这在芯片与芯片之间也有很大差异,甚至在交换机之间也有很大差异)他们)
3) 我们如何检测和分析 TCP 拥塞控制作为性能不佳的潜在解释?
拥塞控制只有在丢包时才会启动。你看到丢包了吗?否则,您可能会达到 tcp 窗口大小与网络延迟因素的限制。
4) 有没有人对这种现象的原因有任何其他理论?如果是,有什么方法可以证明这个理论?
我不明白你在这里提到的现象。我在你的表中看到的只是你有一些带有大发送缓冲区的套接字——这可能是完全合法的。在一台快速的机器上,您的应用程序肯定能够生成比网络能够输出的数据更多的数据,所以我不确定您在这里将什么归类为问题。
最后一点:由于各种原因,小消息会对您的网络造成更大的性能影响,例如:
关于启用 TCP_NODELAY 的 Linux 环回性能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5832308/
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的,
Linux 管道可以缓冲多少数据?这是可配置的吗? 如果管道的两端在同一个进程中,但线程不同,这会有什么不同吗? 请注意:这个“同一个进程,两个线程”的问题是理论上的边栏,真正的问题是关于缓冲的。 最
我找到了here [最后一页] 一种有趣的通过 Linux 启动 Linux 的方法。不幸的是,它只是被提及,我在网上找不到任何有用的链接。那么有人听说过一种避免引导加载程序而使用 Linux 的方法
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visit the help center . 关闭 1
我试图了解 ld-linux.so 如何在 Linux 上解析对版本化符号的引用。我有以下文件: 测试.c: void f(); int main() { f(); } a.c 和 b.c:
与 RetroPie 的工作原理类似,我可以使用 Linux 应用程序作为我的桌面环境吗?我实际上并不需要像实际桌面和安装应用程序这样的东西。我只需要一种干净简单的方法来在 RaspberryPi 上
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 这个问题似乎不是关于 a specific programming problem, a softwar
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题吗? Update the question所以它是on-topic用于堆栈溢出。 关闭 10 年前。 Improve thi
有什么方法可以覆盖现有的源代码,我应该用 PyQt、PyGTK、Java 等从头开始构建吗? 最佳答案 如果您指的是软件本身而不是它所连接的存储库,那么自定义应用程序的方法就是 fork 项目。据我所
我的情况是:我在一个磁盘上安装了两个 linux。我将第一个安装在/dev/sda1 中,然后在/dev/sda2 中安装第二个然后我运行第一个系统,我写了一个脚本来在第一个系统运行时更新它。
我在 i2c-0 总线上使用地址为 0x3f 的系统监视器设备。该设备在设备树中配置有 pmbus 驱动程序。 问题是,加载 linux 内核时,这个“Sysmon”设备没有供电。因此,当我在总线 0
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题吗? Update the question所以它是on-topic用于堆栈溢出。 关闭 11 年前。 Improve thi
我正试图在 linux 模块中分配一大块内存,而 kalloc 做不到。 我知道唯一的方法是使用 alloc_bootmem(unsigned long size) 但我只能从 linux 内核而不是
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 这个问题似乎不是关于 a specific programming problem, a softwar
我有 .sh 文件来运行应用程序。在该文件中,我想动态设置服务器名称,而不是每次都配置。 我尝试了以下方法,它在 CentOS 中运行良好。 nohup /voip/java/jdk1.8.0_71/
我是在 Linux 上开发嵌入式 C++ 程序的新手。我有我的 Debian 操作系统,我在其中开发和编译了我的 C++ 项目(一个简单的控制台进程)。 我想将我的应用程序放到另一个 Debian 操
关闭。这个问题需要多问focused 。目前不接受答案。 想要改进此问题吗?更新问题,使其仅关注一个问题 editing this post . 已关闭 4 年前。 Improve this ques
我使用4.19.78版本的稳定内核,我想找到带有企鹅二进制数据的C数组。系统启动时显示。我需要在哪里搜索该内容? 我在 include/linux/linux_logo.h 文件中只找到了一些 Log
我知道可以使用 gdb 的服务器模式远程调试代码,我知道可以调试针对另一种架构交叉编译的代码,但是是否可以更进一步,从远程调试 Linux 应用程序OS X 使用 gdbserver? 最佳答案 当然
是否有任何可能的方法来运行在另一个 Linux 上编译的二进制文件?我知道当然最简单的是在另一台机器上重建它,但假设我们唯一能得到的是一个二进制文件,那么这可能与否? (我知道这可能并不容易,但我只是
我是一名优秀的程序员,十分优秀!