- r - 以节省内存的方式增长 data.frame
- ruby-on-rails - ruby/ruby on rails 内存泄漏检测
- android - 无法解析导入android.support.v7.app
- UNIX 域套接字与共享内存(映射文件)
众所周知,SO_REUSEPORT 允许多个套接字监听相同的 IP 地址和端口组合,它使每秒请求数增加2 到 3 倍,并减少延迟(~30%) 和延迟的标准差(8 次):https://www.nginx.com/blog/socket-sharding-nginx-release-1-9-1/
NGINX release 1.9.1 introduces a new feature that enables use of the SO_REUSEPORT socket option, which is available in newer versions of many operating systems, including DragonFly BSD and Linux (kernel version 3.9 and later). This socket option allows multiple sockets to listen on the same IP address and port combination. The kernel then load balances incoming connections across the sockets. ...
As shown in the figure, reuseport increases requests per second by 2 to 3 times, and reduces both latency and the standard deviation for latency.
SO_REUSEPORT
在大多数现代操作系统上可用:Linux(kernel >= 3.9 自 29 Apr 2013 )、Free/Open/NetBSD、MacOS、iOS/watchOS/tvOS, IBM AIX 7.2 , Oracle Solaris 11.1 , Windows(只有 SO_REUSEPORT
在 BSD 中表现为 2 个标志一起 SO_REUSEPORT
+SO_REUSEADDR
),并且可能在 Android 上: https://stackoverflow.com/a/14388707/1558037
Linux >= 3.9
- Additionally the kernel performs some "special magic" for
SO_REUSEPORT
sockets that isn't found in other operating systems: For UDP sockets, it tries to distribute datagrams evenly, for TCP listening sockets, it tries to distribute incoming connect requests (those accepted by callingaccept()
) evenly across all the sockets that share the same address and port combination. Thus an application can easily open the same port in multiple child processes and then useSO_REUSEPORT
to get a very inexpensive load balancing.
众所周知,为了避免自旋锁的锁并实现高性能,不应有读取超过 1 个线程的套接字。 IE。每个线程都应该处理自己的套接字以进行读/写。
accept()
是相同套接字描述符的线程安全函数,因此它应该由锁保护 - 因此锁争用会降低性能:http://unix.derkeiler.com/Newsgroups/comp.unix.programmer/2007-06/msg00246.html POSIX.1-2001/SUSv3 requires accept(), bind(), connect(), listen(), socket(), send(), recv(), etc. to be thread-safe functions. It's possible that there are some ambiguities in the standard regarding their interaction with threads, but the intention is that their behaviour in multithreaded programs is governed by the standard.
The receiving performance is down compared to a single threaded program. That's caused by a lock contention on the UDP receive buffer side. Since both threads are using the same socket descriptor, they spend a disproportionate amount of time fighting for a lock around the UDP receive buffer. This paper describes the problem in more detail.
V. K ERNEL ISOLATION
....
From the other side, when the application tries to read data from the socket, it executes a similar process, which isdescribed below and represented in Figure 3 from right to left:
1) Dequeue one or more packets from the receive queue, using the corresponding spinlock (green one).
2) Copy the information to user-space memory.
3) Release the memory used by the packet. This potentiallychanges the state of the socket, so two ways of locking the socket can occur: fast and slow. In both cases, the packet is unlinked from the socket, Memory Accounting statistics are updated and socket is released according to the locking path taken.
即当许多线程访问同一个套接字时,性能会因等待一个自旋锁而下降。
我们有 2 个 Xeon 32 HT-Cores 服务器,共有 64 个 HT-cores,两个 10 Gbit 以太网卡和 Linux(内核 3.9)。
我们使用 RFS 和 XPS - 即在与应用程序线程(用户空间)相同的 CPU 核心上处理相同的 TCP/IP 堆栈(内核空间)连接。
至少有 3 种方法接受连接以在多个线程中处理它:
ip:port
,在每个线程中有 1 个单独的接受器套接字,以及接收连接然后处理它(接收/发送)如果我们接受大量新的 TCP 连接,什么是更有效的方法?
最佳答案
在生产中不得不处理这样的情况,这里有一个解决这个问题的好方法:
首先,设置一个线程来处理所有传入的连接。修改亲和图,使该线程拥有专用核心,应用程序(甚至整个系统)中的其他线程都不会尝试访问该核心。 You can also modify your boot scripts so that certain cores are never automatically assigned to an execution unit unless that specific core is explicitly requested (i.e. isolcpus
kernel boot parameters).
将该核心标记为未使用,and then explicitly request it in your code for the "listen to socket" thread via cpuset
.
接下来,设置一个优先写入操作的队列(最好是优先级队列)(i.e. "the second readers-writers problem).现在,设置您认为合理的工作线程。
此时,“传入连接”线程的目标应该是:
accept()
传入连接。accept()
状态。这将使您能够尽快委派传入的连接。您的工作线程可以在项目到达时从共享队列中获取项目。也可能有第二个高优先级线程从该队列中获取数据,并将其移动到辅助队列,从而避免“监听套接字”线程不得不花费额外的周期来委派客户端 FD。
这也将防止“监听套接字”线程和工作线程不得不同时访问同一个队列,这将使您免受最坏情况的影响,例如慢速工作线程在“监听”时锁定队列套接字”线程想要将数据放入其中。即
Incoming client connections
||
|| Listener thread - accept() connection.
\/
Listener/Helper queue
||
|| Helper thread
\/
Shared Worker queue
||
|| Worker thread #n
\/
Worker-specific memory space. read() from client.
至于您提出的另外两个选项:
Use one acceptor socket shared between many threads, and each thread accept connections and processes it.
凌乱。线程将不得不以某种方式轮流发出 accept()
调用,这样做没有任何好处。您还将有一些额外的排序逻辑来处理哪个线程的“轮到”。
Use many acceptor sockets which listen the same ip:port, 1 individual acceptor socket in each thread, and the thread that receives the connection then processes it (recv/send)
Not the most portable option. I'd avoid it.此外,您可能需要让您的服务器进程使用多进程(即 fork()
)而不是多线程,具体取决于操作系统、内核版本等。
关于c - 我们应该使用多个接受器套接字来接受大量连接吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45001349/
我正在尝试在Elasticsearch中返回的值中考虑地理位置的接近性。我希望近距离比某些字段(例如legal_name)重要,但比其他字段重要。 从文档看来,当前的方法是使用distance_fea
我是Elasticsearch的初学者,今天在进行“多与或”查询时遇到问题。 我有一个SQL查询,需要在Elastic中进行转换: WHERE host_id = 999 AND psh_pid =
智能指针应该/可以在函数中通过引用传递吗? 即: void foo(const std::weak_ptr& x) 最佳答案 当然你可以通过const&传递一个智能指针。 这样做也是有原因的: 如果接
我想执行与以下MYSQL查询等效的查询 SELECT http_user, http_req_method, dst dst_port count(*) as total FROM my_table
我用这两个查询进行测试 用must查询 { "size": 200, "from": 0, "query": { "bool": { "must": [ { "mat
我仍在研究 Pro Android 2 的简短服务示例(第 304 页)同样,服务示例由两个类组成:如下所示的 BackgroundService.java 和如下所示的 MainActivity.j
给定标记 like this : header really_wide_table..........................................
根据 shouldJS 上的文档网站我应该能够做到这一点: ''.should.be.empty(); ChaiJS网站没有使用 should 语法的示例,但它列出了 expect 并且上面的示例似乎
我在 Stack Overflow 上读到一些 C 函数是“过时的”或“应该避免”。你能给我一些这种功能的例子以及原因吗? 这些功能有哪些替代方案? 我们可以安全地使用它们 - 有什么好的做法吗? 最
在 C++11 中,可变参数模板允许使用任意数量的参数和省略号运算符 ... 调用函数。允许该可变参数函数对每个参数做一些事情,即使每个参数的事情不是一样的: template void dummy(
我在我从事的项目之一上将Shoulda与Test::Unit结合使用。我遇到的问题是我最近更改了此设置: class MyModel :update end 以前,我的(通过)测试看起来像这样: c
我该如何做 or使用 chai.should 进行测试? 例如就像是 total.should.equal(4).or.equal(5) 或者 total.should.equal.any(4,5)
如果您要将存储库 B 中的更改 merge 到存储库 A 中,是否应该 merge .hgtags 中的更改? 存储库 B 可能具有 A 中没有的标签 1.01、1.02、1.03。为什么要将这些 m
我正在尝试执行X AND(y OR z)的查询 我需要获得该代理为上市代理或卖方的所有已售属性(property)。 我只用 bool(boolean) 值就可以得到9324个结果。当我添加 bool
我要离开 this教程,尝试使用 Mocha、Supertest 和 Should.js 进行测试。 我有以下基本测试来通过 PUT 创建用户接受 header 中数据的端点。 describe('U
我正在尝试为 Web 应用程序编写一些 UI 测试,但有一些复杂的问题希望您能帮助我解决。 首先,该应用程序有两种模式。其中一种模式是“训练”,另一种是“现场”。在实时模式下,数据直接从我们的数据库中
我有一个规范: require 'spec_helper' # hmm... I need to include it here because if I include it inside desc
我正在尝试用这个测试我在 Rails 中的更新操作: context "on PUT to :update" do setup do @countdown = Factory(:count
我还没有找到合适的答案: onclick="..." 中是否应该转义 &(& 符号)? (或者就此而言,在每个 HTML 属性中?) 我已经尝试在 jsFiddle 和 W3C 的验证器上运行转义和非
import java.applet.*; import java.awt.*; import java.awt.event.*; public class Main extends Applet i
我是一名优秀的程序员,十分优秀!