gpt4 book ai didi

c++ - 将 UDP 数据包发送到同一地址的效率

转载 作者:行者123 更新时间:2023-11-28 05:23:02 25 4
gpt4 key购买 nike

我正在改造现有应用程序中的一些基础设施,该应用程序将 UDP 数据包发送到 1...N 地址(通常是多播)。比方说,目前有 T 个发送器对象,在某些情况下,所有发送器都发送到同一个地址。

因此,为了简化并提供示例,假设有 3 个发送器对象,它们都需要发送到一个特定的地址。我的问题是……哪个更有效率?:

选项 1) 在单个套接字周围放置一个互斥锁,并让所有发送器 (T) 共享同一个套接字。

T----\
T----->Socket
T----/

选项 2)使用三个独立的套接字,所有套接字都发送到同一位置。

T----->Socket 1
T----->Socket 2
T----->Socket 3

我怀疑在使用第二个选项时,操作系统或 NIC 在最终传输周围放置了一个互斥锁,因此从总体上看,选项 2 可能与选项 1 没有太大区别。

下周我可能会在我的开发 PC 上进行实验,但我无法测试用户可能安装的所有潜在计算机配置。我也意识到有不同的实现方式——Windows 与 Linux、不同的 NIC 芯片组制造商等,但我想知道是否有人可能有一些过去的经验或架构知识可以阐明一个选项相对于另一个选项的优势。

谢谢!

最佳答案

在 Windows 10 计算机上运行一些基准测试后,我得到了一个“答案”,它至少让我大致了解会发生什么。我不能 100% 确定每个系统都会以相同的方式运行,但我运行的大多数服务器都使用 Intel NIC 和 Windows 10,而且我的典型数据包大小约为 1200 字节,所以答案至少让我感到舒服这对我的特定情况是正确的。我决定在此处发布结果,以防其他人可以利用该实验。

我构建了一个简单的命令行应用程序,它首先会使用一个带有互斥量的单个套接字生成 T 个发送器线程。紧接着,它将使用相同数量的发射器运行另一项测试,但这次每个发射器都有自己的套接字,因此不需要互斥锁,(尽管我确信在某个较低级别有锁定机制)。每个发送器都尽可能快地发送数据包。

这是我使用的测试设置:

  • 2,700,000 个数据包,每个数据包 1200 字节。
  • Release模式,64 位。
  • i7-3930K CPU、英特尔千兆 CT PCIE 适配器。

这是结果

  • 1 个发送器:SharedSocket = 28.2650 秒:1 个套接字 = 28.2073 秒。
  • 3 个传输器:SharedSocket = 28.4485 秒:MultipleSockets = 27.5190 秒。
  • 6 个发送器:SharedSocket = 28.7414 秒:MultipleSockets = 27.3485 秒。
  • 12 个发送器:SharedSocket = 27.9463 秒:MulitpleSockets = 27.3479 秒。

正如预期的那样,只有一个线程的测试两个线程的时间几乎相同。但是,在具有 3、6 和 12 个发送器的情况下,通过每个线程使用一个套接字而不是共享套接字,可以将性能提高大约 3%。这不是一个巨大的差异,但如果你试图从你的系统中挤出最后一盎司,它可能是一个有用的统计数据。我的特定应用是传输大量视频。

作为健全性检查....这是服务器端 TaskManager 网络页面的屏幕截图。您可以在测试进行到一半时看到吞吐量增加,这与切换到第二个多套接字测试一致。我还附上了客户端计算机的屏幕截图(它是一个 Windows 7 机器)。

Screenshot

关于c++ - 将 UDP 数据包发送到同一地址的效率,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41071500/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com