linux - 竞争 futex 时系统 CPU 使用率高-6ren

linux - 竞争 futex 时系统 CPU 使用率高

转载作者：IT王子更新时间：2023-10-29 00:24:15

38

4

我观察到，当 linux futexes 发生争用时，系统会在自旋锁上花费大量时间。我注意到即使不直接使用 futex 也是一个问题，但在调用 malloc/free、rand、glib 互斥调用和其他调用 futex 的系统/库调用时也是如此。有什么任何方法可以摆脱这种行为？

我正在使用内核为 2.6.32-279.9.1.el6.x86_64 的 CentOS 6.3。我还尝试了直接从 kernel.org 下载的最新稳定内核 3.6.6。

最初，问题发生在具有 16GB RAM 的 24 核服务器上。该进程有 700 个线程。使用“perf record”收集的数据显示，自旋锁是从 __lll_lock_wait_private 和 __lll_unlock_wake_private 调用的 futex 调用的，占用了 50% 的 CPU 时间。当我用 gdb 停止进程时，回溯显示对 __lll_lock_wait_private 和 __lll_unlock_wake_private 的调用是从 malloc 和 free 进行的。

我试图减少这个问题，所以我写了一个简单的程序来显示它确实是导致自旋锁问题的 futexes。

启动 8 个线程，每个线程执行以下操作:

   //...
   static GMutex *lMethodMutex = g_mutex_new ();
   while (true)
   {
      static guint64 i = 0;
      g_mutex_lock (lMethodMutex);
      // Perform any operation in the user space that needs to be protected.
      // The operation itself is not important.  It's the taking and releasing
      // of the mutex that matters.
      ++i;
      g_mutex_unlock (lMethodMutex);
   }
   //...

我在一台 8 核机器上运行它，有足够的 RAM。

使用“top”，我观察到机器空闲10%，用户态10%，系统态90%。

使用“perf top”，我观察到以下内容:

 50.73%  [kernel]                [k] _spin_lock
 11.13%  [kernel]                [k] hpet_msi_next_event
  2.98%  libpthread-2.12.so      [.] pthread_mutex_lock
  2.90%  libpthread-2.12.so      [.] pthread_mutex_unlock
  1.94%  libpthread-2.12.so      [.] __lll_lock_wait
  1.59%  [kernel]                [k] futex_wake
  1.43%  [kernel]                [k] __audit_syscall_exit
  1.38%  [kernel]                [k] copy_user_generic_string
  1.35%  [kernel]                [k] system_call
  1.07%  [kernel]                [k] schedule
  0.99%  [kernel]                [k] hash_futex

我希望这段代码在自旋锁中花费一些时间，因为 futex 代码必须获取 futex 等待队列。我还希望代码在系统中花费一些时间，因为在这段代码中，用户空间中运行的代码非常少。然而，50% 的时间花在自旋锁上似乎有些过分，尤其是当需要这段 cpu 时间来做其他有用的工作时。

最佳答案

我也遇到过类似的问题。我的经验是，根据 libc 版本和许多其他晦涩的事情(例如调用 fork() 之类的 here )，您可能会在大量锁定和解锁时看到性能下降甚至死锁。

This guy通过切换到 tcmalloc 解决了他的性能问题，这可能是一个好主意，具体取决于用例。您也值得一试。

对我来说，当我有多个线程进行大量锁定和解锁时，我看到了可重现的死锁。我从 2010 年开始使用带有 libc 的 Debian 5.0 rootfs(嵌入式系统)，通过升级到 Debian 6.0 解决了这个问题。

关于linux - 竞争 futex 时系统 CPU 使用率高，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/13293452/

38

4

0

文章推荐： linux - waitpid() 是做什么的？

文章推荐： linux - 我如何模拟 ext3 文件系统损坏？

文章推荐： c - 构建 USB 外设

c++ - 异步过程调用中的 GetLastError 竞争
假设我正在使用 APC，其中过程和调用代码都使用 SetLastError 和 GetLastError。这会导致 GetLastError 产生不可预测的值。有什么办法可以解决这个问题吗？ VOID
emacs - 哪些现代编辑器与 emacs/vi 竞争？
关闭。这个问题是opinion-based .它目前不接受答案。想改善这个问题吗？更新问题，以便可以通过 editing this post 用事实和引文回答问题. 7年前关闭。 Improve t
grails - 服务器端推送(竞争)以填充完整的Calendar事件，而无需在Grails中进行javascript轮询。
任何人都可以，请告诉我，如何在不进行JavaScript轮询/ setInterval的情况下，在完整日历上填充/显示在服务器端动态更新的数据。 grails中提供了Atmosphere插件，但是文档
ios - WKWatchConnectivityRefreshBackgroundTask 与 WCSessionDelegate 竞争
我正在尝试调整我的代码，从仅在前台使用 WCSessionDelegate 回调到在后台通过 handleBackgroundTasks: 接受 WKWatchConnectivityRefreshB
c# - EF 竞争 SaveChanges() 调用
我正在构建批处理系统。单位的批处理数量从 20 到 1000 不等。每个 Unit 本质上都是模型的层次结构(一个主模型和许多子模型)。我的任务涉及将每个模型层次结构作为单个事务保存到数据库中(每
CSS Float/Clear Puzzle(竞争 float )
我拍了一张图片并将其切成三 block ，然后将它们向右浮动，让文字围绕它们流动。 HTML 看起来像这样: 在我添加侧边栏并将其 float 到图像的右上方之前，它工作正常，就像这样... T
linux - 如何在 Linux 中避免共享 IRQ 竞争
我正在考虑嵌入式 Linux 项目(还没有硬件)中即将出现的情况，其中两个外部芯片需要共享一条物理 IRQ 线。这条线在硬件中能够实现边沿触发，但不能实现电平触发中断。查看 Linux 中的共享 i
linux - 竞争 futex 时系统 CPU 使用率高
我观察到，当 linux futexes 发生争用时，系统会在自旋锁上花费大量时间。我注意到即使不直接使用 futex 也是一个问题，但在调用 malloc/free、rand、glib 互斥调用和其
jquery-ui - jQueryUI Tooltips 正在与 Twitter Bootstrap 竞争
我终于能够获得一些工具提示，最终可以使用以下代码: Hover over me 然后 $('[rel=tooltip]').tooltip(); 我遇到的问题是它使用 jQueryUI 工

首页

博学

6Ren·AI

商城

linux - 竞争 futex 时系统 CPU 使用率高