- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
问题:我们在Windows Server 2012系统上实现了一个视频录制系统。尽管 CPU 和内存消耗很低,但我们面临着严重的性能问题。
简短的程序描述:应用程序 (VS2005/C++) 创建许多网络套接字,每个套接字从以太网接收多播 UDP 视频流。对于每个流,应用程序通过调用 WSARecvFrom()(重叠操作)提供接收缓冲区,在 MsgWaitForMultipleObjects() 中等待窗口的“数据到达”事件,获取数据包,然后在无休止的循环中再次重复所有操作。对于测试,为了确保除了纯套接字 IO 工作之外的最小 CPU 和内存消耗,应用程序什么都不做,也不做任何磁盘/文件 IO。应用程序进程配置为使用机器上的所有可用核心(默认关联设置不变)。
测试运行:测试在两台不同的机器上运行:a) 具有 4 个物理内核/8 个具有超线程的 Windows 7,以及 b) 具有 12 个物理内核/24 个具有超线程的 Windows Server 2012。
两个系统都显示出相同的问题:在配置一定数量的套接字/网络流之前一切正常。进一步增加它们(我们需要)最终使 Windows 桌面瘫痪(鼠标指针、重新绘制)。在此阶段,总 CPU 负载仍然很低(即 10-15%),并且有很多空闲内存可用。但是任务管理器显示出极端单向的 CPU 负载:CPU 0 接近 100%,所有其他 CPU 接近 0%。在任务管理器中更改进程的处理器亲和性没有帮助。
问题 1:看起来 CPU 0 正在做整个内核的网络 IO 工作。这可能吗?
问题 2:如果是,有没有办法控制内核对可用 CPU 的使用?如果是,怎么办?
问题 3:如果不是,是否有任何其他方式让 Windows 将(内核)网络 IO 工作分配给其他 CPU(即通过安装多个 NIC 卡,每个 NIC 只接收网络流的一个子集,并绑定(bind)每个NIC 到另一个 CPU) ?
非常感谢任何人的提示。
最佳答案
我不是 Windows 服务器专家,但这听起来像是一个中断问题。这经常发生在高吞吐量系统中,尤其是实时系统。
背景:
简单来说,对于每个数据包,您的网络接口(interface)都会生成一个中断,通知 CPU 它需要处理新到达的数据。接收小数据包的高吞吐量网卡(例如 10Gbps)很容易因这些中断而使 CPU 不堪重负。
为了了解这个问题,让我们做一些数学运算——如果您用 100 字节数据包使 10G 线路饱和,这意味着(理想情况下)每秒通过线路发送 12,500,000 个数据包。实际上,由于开销较少;比如说每秒 10,000,000 个数据包 (pps)。你的 3Ghz cpu 每秒产生 3,000,000,000 个时钟。所以它需要每 300 个时钟周期处理一个数据包。这对于通用机器来说相当困难。
现在,我不知道您的数据包到达率,也不知道您的平均数据包长度。但根据您描述的症状,您可能遇到了这个问题。
解决方案
现代网卡,尤其是高吞吐量网卡,支持各种有用的卸载,例如 GRO , TOE , 和别的。这些从 CPU 中取出一些与网络相关的工作(例如校验和计算、数据包分段等),并将其放在带有专用硬件的网卡上执行。检查您的卡支持的卸载。在 Linux 中,管理卸载是使用名为 ethtool 的应用程序执行的。由于我没玩过windows的offloading,所以只能指向most relevant windows article I found的方向,但我无法提供任何基于经验的建议。
中断节流是(某些)网卡及其驱动程序的另一种能力,它允许它们限制您的 CPU 接收的中断数量,本质上是每隔几个数据包就中断一次核心,而不是每个数据包一次。
一些网卡有多个(数据包)队列,因此有多个中断线,每个队列一个。他们使用哈希函数在队列之间平均分配传入流量,以 1/8 或 1/16 的线路速率创建(通常)8 或 16 个流。每个流都可以使用中断 affinity 绑定(bind)到特定的 CPU 内核,并且由于哈希函数是根据 IP 和端口号计算的,并且是确定性的,因此每个 TCP/IP 级别的 session 将始终由同一个核心。在 Linux 中,设置亲和性需要写入 /proc/irq/<interrupt number>/smp_affinity
.在 Windows 中,this似乎是这样。
关于visual-c++ - Windows 桌面在繁重的网络 I/O 期间变得瘫痪/Windows 内核仅分配了众多 CPU 中的 1 个?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27461689/
在使用 requests 库中的状态代码时,我遇到了一些奇怪的事情。每个 HTTP 状态代码都有一个常量,有些具有别名(例如,包括 200 的复选标记): url = 'https://httpbin
这是我得到的代码,但我不知道这两行是什么意思: o[arr[i]] = o[arr[i]] || {}; o = o[arr[i]]; 完整代码: var GLOBAL={}; GLOBAL.name
所以这个问题的答案What is the difference between Θ(n) and O(n)? 指出“基本上,当我们说算法是 O(n) 时,它也是 O(n2)、O(n1000000)、O
这是一个快速的想法;有人会说 O(∞) 实际上是 O(1) 吗? 我的意思是它不依赖于输入大小? 所以在某种程度上它是恒定的,尽管它是无限的。 或者是唯一“正确”的表达方式 O(∞)? 最佳答案 无穷
这是真的: log(A) + log(B) = log(A * B) [0] 这也是真的吗? O(log(A)) + O(log(B)) = O(log(A * B)) [1] 据我了解 O(f
我正在解决面试练习的问题,但我似乎无法找出以下问题的时间和空间复杂度的答案: Given two sorted Linked Lists, merge them into a third list i
我了解 Big-Oh 表示法。但是我该如何解释 O(O(f(n))) 是什么意思呢?是指增长率的增长率吗? 最佳答案 x = O(n)基本上意味着 x <= kn对于一些常量 k . 因此 x = O
我正在编写一个函数,该函数需要一个对象和一个投影来了解它必须在哪个字段上工作。 我想知道是否应该使用这样的字符串: const o = { a: 'Hello There' }; funct
直觉上,我认为这三个表达式是等价的。 例如,如果一个算法在 O(nlogn) + O(n) 或 O(nlogn + n) 中运行(我很困惑),我可以假设这是一个O(nlogn) 算法? 什么是真相?
根据 O'Reilly 的 Python in a Nutshell 中的 Alex Martelli,复杂度类 O(n) + O(n) = O(n)。所以我相信。但是我很困惑。他解释说:“N 的两个
O(n^2)有什么区别和 O(n.log(n)) ? 最佳答案 n^2 的复杂性增长得更快。 关于big-o - 大 O 符号 : differences between O(n^2) and O(n
每当我收到来自 MS outlook 的电子邮件时,我都会收到此标记 & nbsp ; (没有空格)哪个显示为?在 <>. 当我将其更改为 ISO-8859-1 时,浏览器页面字符集编码为 UTF-8
我很难理解 Algorithms by S. Dasgupta, C.H. Papadimitriou, and U.V. Vazirani - page 24 中的以下陈述它们将 O(n) 的总和表
我在面试蛋糕上练习了一些问题,并在问题 2给出的解决方案使用两个单独的 for 循环(非嵌套),解决方案提供者声称他/她在 O(n) 时间内解决了它。据我了解,这将是 O(2n) 时间。是我想错了吗,
关于 Java 语法的幼稚问题。什么 T accept(ObjectVisitorEx visitor); 是什么意思? C# 的等价物是什么? 最佳答案 在 C# 中它可能是: O Accept(
假设我有一个长度为 n 的数组,我使用时间为 nlogn 的排序算法对它进行了排序。得到这个排序后的数组后,我遍历它以找到任何具有线性时间的重复元素。我的理解是,由于操作是分开发生的,所以时间是 O(
总和 O(1)+O(2)+ .... +O(n) 的计算结果是什么? 我在某处看到它的解决方案: O(n(n+1) / 2) = O(n^2) 但我对此并不满意,因为 O(1) = O(2) = co
这个问题在这里已经有了答案: 11 年前关闭。 Possible Duplicate: Plain english explanation of Big O 我想这可能是类里面教的东西,但作为一个自学
假设我有两种算法: for (int i = 0; i 2)更长的时间给定的一些n - 其中n这种情况的发生实际上取决于所涉及的算法 - 对于您的具体示例, n 2)分别时间,您可能会看到: Θ(n)
这个问题在这里已经有了答案: Example of a factorial time algorithm O( n! ) (4 个回答) 6年前关闭。 我见过表示为 O(X!) 的 big-o 示例但
我是一名优秀的程序员,十分优秀!