- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
这里让我摸不着头脑。希望有人能帮我解决问题。
我有一台 Dell PowerEdge SC1435 服务器,它已经在以前版本的 ubuntu 上运行了一段时间。 (我相信它是 13.10 服务器 x64)
我最近重新格式化了驱动器 (SSD) 并安装了 ubuntu 服务器 14.04.1 x64。
安装过程中一切似乎都很好,但机器在内核输出结束时首次启动时挂起,就在我期望屏幕清除并出现登录提示之前。我看到的内核输出末尾没有明显的错误。 (有一条关于“不使用不可靠的CPU热传感器”的消息,但无论是否启动,该消息似乎都存在)
我给了它足足 5 分钟的时间,然后强制重新启动。令我惊讶的是,它在 BIOS 发布后大约 1-2 秒内启动到登录提示符。我再次重新启动,它似乎在之前挂起的地方暂停了几秒钟,但继续进入登录屏幕。再次重启,速度又快了。所以在这一点上,我认为这只是那些随机的一次性故障之一,我永远无法解释,所以我继续前进。
我安装了一些软件包(在其他硬件上的相同操作系统版本上安装了完全相同的软件包),进行了 apt Upgrade 和 dist-upgrade 然后重新启动。它似乎再次挂起,所以我开车到数据中心并连接控制台,结果却出现空白屏幕。再次强制重启。 (还设置了 ipmi 进行远程重新启动并摆脱了 grub recordfail,这样它就不会等待我按 Enter 键!)
昨晚已经很晚了。我回到家,重新启动了几次,没有出现任何问题,然后就去 sleep 了。今天我再次重新启动来检查它,但它又在某个地方崩溃了。我远程强制重新启动它。
此时我开始进一步挖掘,并立即注意到一些非常奇怪的事情。
top - 14:18:35 up 8 min, 1 user, load average: 1.00, 0.85, 0.45
Tasks: 148 total, 1 running, 147 sleeping, 0 stopped, 0 zombie
%Cpu(s): 0.1 us, 0.3 sy, 0.0 ni, 99.6 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
KiB Mem: 33013620 total, 338928 used, 32674692 free, 9740 buffers
KiB Swap: 3906556 total, 0 used, 3906556 free. 47780 cached Mem
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
1 root 20 0 33508 2772 1404 S 0.0 0.0 0:03.82 init
2 root 20 0 0 0 0 S 0.0 0.0 0:00.00 kthreadd
3 root 20 0 0 0 0 S 0.0 0.0 0:00.00 ksoftirqd/0
5 root 0 -20 0 0 0 S 0.0 0.0 0:00.00 kworker/0:0H
6 root 20 0 0 0 0 S 0.0 0.0 0:00.00 kworker/u16:0
8 root 20 0 0 0 0 S 0.0 0.0 0:00.24 rcu_sched
9 root 20 0 0 0 0 S 0.0 0.0 0:00.02 rcuos/0
10 root 20 0 0 0 0 S 0.0 0.0 0:00.00 rcuos/1
11 root 20 0 0 0 0 S 0.0 0.0 0:00.00 rcuos/2
该服务器完全未使用且空闲,但其 1 分钟平均负载恰好为 1.00?当我观察其他值时 - 5 分钟和 15 分钟似乎也趋向 1.00,因此我假设它们在某个时刻都会达到 1.00。 (“1 Running”是最上面的进程)
我以前从未遇到过这种情况,因为我不知道是什么导致启动崩溃,所以我现在假设两者可能相关。
我想做的是确定(并希望消除)导致错误平均负载和崩溃问题的原因。
到目前为止,我无法确定哪些进程可能正在等待某种资源来生成该平均负载。
如果有人能帮助我尝试追踪它,我将非常感激。
top 显示所有进程几乎总是处于 sleep 状态。有些偶尔会出现在顶部,但我认为这很正常。 CPU 使用率大多显示 100% IDLE,偶尔会下降到 99% 左右。
nmon 没有向我展示太多内容。一切看起来都是闲置的。
iotop 几乎没有显示任何流量。 (同样,非常偶尔的磁盘访问)
中断频率似乎很低。据我所知,速度低于 100/秒。
我看到很多谷歌讨论都表明了这一点:
echo 100 > /sys/module/ipmi_si/parameters/kipmid_max_busy_us
..没有效果。
服务器中的 RAM 是 ECC 且测试通过。
服务器安装是“最小化”(F4 选项),安装过程中勾选了 OpenSSH 服务器。之后安装了一些软件包,包括vim、bcache-tools、bridge-utils、qemu、software-properties-common、open-iscsi、qemu-kvm、cpu-checker、socat、ntp和nodejs。 (想想就是这样)
我尝试禁用并删除 bcache 内核模块。没有效果。停止了 iSCSI 服务..没有效果。 (尽管该服务器上还没有任何配置)
在这变得太长之前我会把它留在那里。如果有人能帮助我尝试解决这个问题,我将非常感激。
干杯,
詹姆斯
最佳答案
1.0 的平均负载是 bcache 回写线程处于不间断 sleep 状态的结果。它可能会在 3.19 内核或更高版本中得到纠正。请参阅this Debian bug report例如。
关于linux - ubuntu 14.04.1 服务器空闲负载平均 1.00,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26122438/
我正在尝试使用以下命令在远程 Ubuntu 服务器的后台运行进程: sshpass -p PASSWORD ssh root@HOST 'nohup COMMAND-THAT-BLOCKS &' 不幸
普通 Ubuntu 和 ARM Ubuntu 有什么区别。我可以运行所有应用程序吗也在 ARM Ubuntu 中的普通 Ubuntu 下运行? Ubuntu 更新会自动发生吗? Torrent 下载器
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题? Update the question所以它是on-topic对于堆栈溢出。 9年前关闭。 Improve this que
我正在尝试预置 Xenial 图像,它工作得很好,除了分区。 cloud-init 只能增长根分区,并且在使用扩展分区内的根文件系统构建镜像时不起作用: NAME MAJ:MIN RM SIZ
我对 Ubuntu 和 OpenFoam 真的很陌生,所以尝试学习并做一些教程。我正在使用 Docker 在 Ubuntu 上使用 OpenFoam。 我将文件夹复制到特定目录,但是当我尝试使用终端访
我在使用系统启动设置运行软件时遇到问题。我有 ubuntu 20.04。我试图将这些行插入到 etc/rc.local #!/bin/bash /usr/bin/clamonacc 它不起作用。第二次
TARGETS = client server CL_OBJ = clientMain.o Controller.o UI.o List.o Movie.o Server.o Serializer.o
我有一个 ubuntu服务器系统是8.04 hardy ,我在哪里安装rabbitmq。 rabbitmq依赖于 erlang-nox (>= 1:12.b.3) ,但是在当前的 ubuntu 版本中
我有一个用于开发的 Ubuntu virtualbox 设置。当我在文件中处于 org-mode 时,org-mode 的任何热键都不起作用(例如 M-RETURN 用于创建新标题)。我该怎么做才能让
我的 SchemaCrawler(版本 15.01.03)模式图在 Ubuntu 18.04 LTS 上截断表名。看起来表格通常被画得太窄,因为“[TABLE]”符号也开箱即用。在我的 Mac 上渲染
在 Ubuntu 中,设置应用程序中有几个地方有一个非常漂亮的 ListView ,带有添加/删除按钮,包括外观、键盘布局、隐私、蓝牙等。他们使用什么小部件?我开始使用 Glade 开发我的第一个 U
需要帮助卸载 jjrofiler。没有意识到它需要许可证。通过 .sh 可执行文件安装。 最佳答案 如果您转到 jProfiler 安装目录,您将找到名为 uninstall 的可执行文件,只需从终端
我一直在寻找几天,我没有想出解决方案。我是 ruby 新手,但我想通过使用 spree 开发自己的在线商店。 我使用:rails:Rails 3.2.13 ruby :ruby-1.9.3-p42
我尝试使用以下命令从/usr/local/bin 中删除我的 python2.7 和 python3 文件夹:sudo rm -rf python2.7 和 sudo rm -rf python3。后
在 ubuntu 服务器中(使用 ssh 协议(protocol)), 如何更改因不活动而断开连接的时间? 最佳答案 你能在 .bash_profile 中加入“exec screen -R”,在 .
我使用以下配置在 /etc/apache2/site-available/mysite.local 中创建了一个虚拟主机: ServerAdmin webmaster@localhost
我为大约 210 个用户新设置了一个代理服务器。它运行 ubuntu server 2012 和 squid3。问题是在凌晨 1:30 之后,如果用户尝试打开 google.com、youtube.c
gitlab-ci-multi-runner 1.0.2 (ea19241) Using Shell executor... Running on ip-... Cloning repository.
我有一个备份服务器,它每小时接收许多 rsync 连接。由于打开太多 rsync 实例可能会导致崩溃,我想使用 Semaphore 来限制并发实例的数量。 .我的想法是这样的: ssh root@ba
我有同一个库的多个版本,我的程序动态链接到这些库。有时我想更改使用的版本。 我一直在阅读,出于安全原因,新版本的 Ubuntu 不再支持 LD_LIBRARY_PATH。我可以将路径添加到 /etc/
我是一名优秀的程序员,十分优秀!