- r - 以节省内存的方式增长 data.frame
- ruby-on-rails - ruby/ruby on rails 内存泄漏检测
- android - 无法解析导入android.support.v7.app
- UNIX 域套接字与共享内存(映射文件)
我公司今天遇到了一个严重的问题:我们的生产服务器宕机了。大多数通过浏览器访问我们软件的人无法建立连接,但是已经使用该软件的人能够继续使用它。甚至我们的热备用服务器也无法与使用 HTTP 的生产服务器通信,甚至无法连接到更广泛的互联网。服务器一直可以通过 ping 和 ssh 访问,实际上负载很低——它通常以 5% 的 CPU 负载运行,而此时甚至更低。我们几乎不做磁盘 i/o。
问题开始几天后,我们有了一个新变体:端口 443 (HTTPS) 正在响应,但端口 80 停止响应。服务器负载很低。重启tomcat后,80端口又开始响应了。
我们使用的是 tomcat7,maxThreads="200",并使用 maxConnections=10000。我们在主内存之外提供所有数据,因此每个 HTTP 请求都非常快地完成,但是我们有大量用户在进行非常简单的交互(这是高中科目选择)。但我们似乎不太可能让 10,000 名用户同时在我们的页面上打开他们的浏览器。
我的问题有几个部分:
但主要问题是,“我们如何修复我们的服务器?”
Stefan 和 Sharpy 要求的更多信息:
更多信息:当我们意识到我们正在使用 BIO 的默认 Tomcat7 设置时,看起来我们真的解决了问题,每个连接有一个线程,并且我们有 maxThreads=200。事实上,“netstat -an”显示了大约 297 个连接,这与 200 + 队列 100 相匹配。因此我们将其更改为 NIO 并重新启动了 tomcat。不幸的是,第二天又出现了同样的问题。我们可能错误配置了 server.xml。
server.xml 和来自 catalina.out 的提取物可在此处获得: https://www.dropbox.com/sh/sxgd0fbzyvuldy7/AACZWoBKXNKfXjsSmkgkVgW_a?dl=0
更多信息:我做了负载测试。我能够从我的开发笔记本电脑创建 500 个连接,并在每个连接上执行 HTTP GET 3 次,没有任何问题。除非我的负载测试无效(Java类也在上面的链接中)。
最佳答案
如果没有动手调试,很难确定,但我要检查的第一件事就是文件描述符限制(即 ulimit -n
)。 TCP 连接使用文件描述符,并且根据正在使用的实现,使用 SelectableChannel
进行轮询的 nio 连接。每个打开的套接字可能会吃掉几个文件描述符。
检查是否是这个原因:
ps
查找 Tomcat PIDs ulimit
该过程运行:cat /proc/<PID>/limits | fgrep 'open files'
ls /proc/<PID>/fd | wc -l
如果使用的描述符数量明显低于限制,则可能是其他原因导致了您的问题。但是,如果它等于或非常接近极限,则正是这个极限导致了问题。在这种情况下,您应该增加 /etc/security/limits.conf
中的限制对于使用其帐户运行 Tomcat 并从新打开的 shell 重新启动进程的用户,使用 /proc/<PID>/limits
检查如果实际使用了新限制,并查看 Tomcat 的行为是否有所改善。
关于linux - 奇怪的 Tomcat 中断,可能与 maxConnections 有关,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25766228/
这很可能是我的语法错误,因为我对在 C++ 中使用多个文件和结构(特别是将结构传递给函数)还很陌生。这是三个文件: 主要.cpp: #include #include #include #inc
我有 TypeScript NestJS 项目。 我需要验证传入的 DTO 到我的 API。它可以被描述为“创建项目”,其中我们有建筑类型(房屋、公寓、花园),并根据该类型我们需要定义: 房屋:楼层包
是否可以从可用于泛型参数的可能类型集中排除特定类型?如果是如何。 例如 Foo() : where T != bool 将意味着除了类型 bool 之外的任何类型。 编辑 为什么? 以下代码是我尝试强
我的 WebGL 体积光线转换应用程序即将完成。但是我发现了一个问题。我必须通过 2D 纹理模拟 3D 纹理。这不是问题。我正在用小切片创建一个巨大的纹理。巨大纹理的尺寸约为 4096x4096 像素
我正在处理的网页上显示了一个返回顶部按钮。当您向下滚动时,有时单击它时,它会跳到顶部,然后跳回您在页面上的位置,然后像预期的那样平滑滚动到顶部。请记住,它并不总是这样做。这只是一个滞后或故障问题还是我
我对此还很陌生,所以请耐心等待。 我有一个类,它具有三个属性:几个整数和一个用户定义对象的集合。 public class Response { public int num1 { get;
我正在制作一款平台游戏,让玩家每 30 毫秒跳跃一次,并向上添加少量的力。我想我应该使用多线程,因为我之前已经做过一些,而且看起来很简单。无论如何,我尝试了这个: public void jump()
是否可以从可能的类型集中排除特定类型,这些类型可以在泛型参数中使用?如果是这样的话。 例如 Foo() : where T != bool 表示除 bool 类型之外的任何类型。 编辑 为什么? 以下
我正在尝试在单个查询中实现内部和外部联接,我不确定我的做法是正确还是错误,因为我不太擅长查询。 就这样吧。 我有以下表格。 hrs_residentials hrs_residential_utili
关于 my website ,有一段代码可以向页面添加几个元素。这段代码不是我可以编辑的东西,而且我对它放置这些元素的位置不满意,因为它弄乱了我的一些布局。所以我想出了一个小的 jQuery 来将它们
一位客户希望我创建一个数据集,如下所示。我不知道这是否可能或合乎逻辑。 我有表parent: id name ------- ------- 1 parent1 2
这可能吗?google 好像没有这方面的资料.. 这样,如果用户在另一个网站上播放视频或歌曲,我的音量就会自动减小 最佳答案 不,这是不可能的。 如果可能的话,它必须是特定于浏览器的,但我不认为这种情
所以我正在尝试制作响应式页面。问题是为什么它归结为移动数据需要位于列表中。 我会用一些示例代码来解释 所以这可能是桌面上的输出 option1
当您将鼠标悬停在a 元素 上时,是否可以删除url? 这就是我的意思: 最佳答案 一种选择是使用一些 JavaScript。 删除 href=来自 的属性标签,取而代之的是 onclick=...
我已经考虑了几个小时,但我无法取得太大进展。它是这样的: You have an array of size n and q queries. Each query is of the form (l
我一直在尝试编写一个脚本来强化 android。我没有成功! 我正在通过模拟器运行一个 AVD,并且已经用我加载的 android shell 和 bash shell 试过了。正如您将在下面看到的那
Private Sub Workbook_Open() Dim WBname As String WBname = ThisWorkbook.name If Not InStr(WBname, "te
Spark 2.0.0-预览版 我们有一个应用程序使用了相当大的广播变量。我们在大型 EC2 实例上运行它,因此部署处于客户端模式。广播变量是一个巨大的 Map[String, Array[Strin
我正在尝试从此link中提取摘要。但是,我无法仅提取摘要的内容。到目前为止,这是我完成的工作: url <- "http://www.scielo.br/scielo.php?script=sci_a
我的主页中有一个iframe。 iframe页面中有一个modalpopup。因此,当显示modalpopup时,modalpopup的父级是iframe主体和主页父级主体。因此,覆盖层仅覆盖ifra
我是一名优秀的程序员,十分优秀!