- r - 以节省内存的方式增长 data.frame
- ruby-on-rails - ruby/ruby on rails 内存泄漏检测
- android - 无法解析导入android.support.v7.app
- UNIX 域套接字与共享内存(映射文件)
我公司今天遇到了一个严重的问题:我们的生产服务器宕机了。大多数通过浏览器访问我们软件的人无法建立连接,但是已经使用该软件的人能够继续使用它。甚至我们的热备用服务器也无法与使用 HTTP 的生产服务器通信,甚至无法连接到更广泛的互联网。服务器一直可以通过 ping 和 ssh 访问,实际上负载很低——它通常以 5% 的 CPU 负载运行,而此时甚至更低。我们几乎不做磁盘 i/o。
问题开始几天后,我们有了一个新变体:端口 443 (HTTPS) 正在响应,但端口 80 停止响应。服务器负载很低。重启tomcat后,80端口又开始响应了。
我们使用的是 tomcat7,maxThreads="200",并使用 maxConnections=10000。我们在主内存之外提供所有数据,因此每个 HTTP 请求都非常快地完成,但是我们有大量用户在进行非常简单的交互(这是高中科目选择)。但我们似乎不太可能让 10,000 名用户同时在我们的页面上打开他们的浏览器。
我的问题有几个部分:
但主要问题是,“我们如何修复我们的服务器?”
Stefan 和 Sharpy 要求的更多信息:
更多信息:当我们意识到我们正在使用 BIO 的默认 Tomcat7 设置时,看起来我们真的解决了问题,每个连接有一个线程,并且我们有 maxThreads=200。事实上,“netstat -an”显示了大约 297 个连接,这与 200 + 队列 100 相匹配。因此我们将其更改为 NIO 并重新启动了 tomcat。不幸的是,第二天又出现了同样的问题。我们可能错误配置了 server.xml。
server.xml 和来自 catalina.out 的提取物可在此处获得: https://www.dropbox.com/sh/sxgd0fbzyvuldy7/AACZWoBKXNKfXjsSmkgkVgW_a?dl=0
更多信息:我做了负载测试。我能够从我的开发笔记本电脑创建 500 个连接,并在每个连接上执行 HTTP GET 3 次,没有任何问题。除非我的负载测试无效(Java类也在上面的链接中)。
最佳答案
如果没有动手调试,很难确定,但我要检查的第一件事就是文件描述符限制(即 ulimit -n
)。 TCP 连接使用文件描述符,并且根据正在使用的实现,使用 SelectableChannel
进行轮询的 nio 连接。每个打开的套接字可能会吃掉几个文件描述符。
检查是否是这个原因:
ps
查找 Tomcat PIDs ulimit
该过程运行:cat /proc/<PID>/limits | fgrep 'open files'
ls /proc/<PID>/fd | wc -l
如果使用的描述符数量明显低于限制,则可能是其他原因导致了您的问题。但是,如果它等于或非常接近极限,则正是这个极限导致了问题。在这种情况下,您应该增加 /etc/security/limits.conf
中的限制对于使用其帐户运行 Tomcat 并从新打开的 shell 重新启动进程的用户,使用 /proc/<PID>/limits
检查如果实际使用了新限制,并查看 Tomcat 的行为是否有所改善。
关于linux - 奇怪的 Tomcat 中断,可能与 maxConnections 有关,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25766228/
#include int main() { int i; for( i = 0; i< 10 ; i++ ) { printf("test1 &d", i);
我有一个连接到远程服务器以查询数据的 C# 程序。数据很大,所以查询大约需要 2 分钟才能完成。在这 2 分钟的时间内,互联网中断了。这导致作业无法完成,程序卡在获取数据例程中。 它建立了连接,但在选
语句 1: [2,4,6,7,8].each do |i| (i % 2 == 0) || (puts "Not even" && break) puts i end 声明 2: [2
我想知道 C++ 是否有任何处理中断的方法。我希望一个程序将信息存储在文本文件中,而另一个程序根据文本文件中的内容打印一条语句。由于我希望它尽可能准确,因此我需要在更新程序更新文件时中断打印程序。 最
我正在尝试终止一个线程,但它不会中断或停止。所有这些都是名为 Webots 的软件 Controller 的一部分。我用它来模拟多机器人系统。在每个机器人的 Controller 中,我启动了一个线程
中断10h可以使用的服务有很多, 我想问一下关于其中两个我很困惑的问题 首先是, AH = 06H SCROLL UP WINDOW AH = 07H SCROLL DOWN WINDOW 在 D
我有一个基本的 SQL 问题,如果有两个事件连接,"A"和 "B"到 SQL 服务器,假设两者之间发生死锁,那么为了避免死锁,SQL 服务器将回滚其中一个连接“A”或“B”的交易。假设 SQL Ser
我有一个 mapkit/ View ,它工作正常 - 但我滚动并在 2 - 10 次移动后我的应用程序崩溃了......而且这只是一个“中断”。 这是我的代码的一部分。我认为这是后台线程和数组释放/覆
有什么办法可以做到,比如 C/C# ? 例如(C#风格) for (int i = 0; i Seq.tryFind (fun i -> printfn "%d" i i=66) 在实践中,
我的问题是Haskell如何与系统交互。 例如,IO如何发生? 我对IO monad不感兴趣。或者如何使Haskell打印字符串或读取文件。 我对Haskell和底层操作系统之间的层(如果是这样的话)
你能确认下一个break是否取消了内部for循环吗? for (out in 1:n_old){ id_velho <- old_table_df$id[out] for
我有一个程序可以进行一些数据分析,并且有几百行长。 在程序的早期,我想做一些质量控制,如果没有足够的数据,我希望程序终止并返回到 R 控制台。否则,我希望执行其余代码。 我尝试过break、brows
我有一个 if 语句,用于检查我的对象(向导)是否命中了项目。如果他这样做了,巫师的大小将会改变,他应该能够在与障碍物的 1 次碰撞中幸存。 现在我陷入了“在 1 个障碍物碰撞中幸存”,因为在我的碰撞
我正在尝试使用迭代器来显示很多内容。我不断收到“break;”错误线。它说这是一个无法访问的声明。如有任何帮助,我们将不胜感激。 public Lot getLot(int number) {
我正在创建一个应用程序,我需要在其中处理可能非常庞大且可能需要一些时间的数据。 现在我阅读了很多关于 IntentService 的资料,实际上我已经将它实现为处理 REST 调用的通信类,但现在我试
我有一个自定义的 UITableViewCell。该单元具有三个标签。最左边的“金额”标签具有以下约束。 在单元格的右侧,我有另一个标签,“Label Dollar Amount”。它具有以下约束:
我有以下不和谐嵌入: message.reply({ content: '', embed: { color: 11416728, author
JavaScript 不是我最擅长的技能,但我会尽力解释,所以就这样吧。我有人在我的网站上创建了一个幻灯片菜单,我也使用 jplayer 音乐播放器。 现在一切正常,直到我在顶部添加此脚本。由于某种原
我已经在 Ubuntu 上安装了 android studio,有一个带有损坏图像的 API,我也尝试过重新安装。我应该怎么做才能克服这个问题。 删除它后,它没有在 sdk 管理器中显示 提前致谢。
假设我的站点上有大约 10 个 css 文件。我想把它们合二为一。但是当我组合它们时(只是“连接”文件,以便将它们包含到 html 中),我的样式/布局中断了。这不是路径问题或其他问题,只是选择器无法
我是一名优秀的程序员,十分优秀!