gpt4 book ai didi

asp.net - 在非生产环境中复制与负载相关的崩溃

转载 作者:行者123 更新时间:2023-12-03 15:27:53 25 4
gpt4 key购买 nike

我们正在 Intranet 上运行自定义应用程序,最近升级后发现问题,IIS 挂起,CPU 使用率 100%,需要重置。

在确定解决方案的同时,我们没有让用户陷入挂起状态,而是回滚到以前的版本。第一步是重现问题——但我们不能。

这是一些背景:

Prod 有一个带有两个 CPU 和 2 GB RAM 的虚拟化 (vmware) Web 服务器。数据库服务器有 4GB 和 2 个 CPU。它也在 VMWare 上,但单独的物理硬件。

在正常使用期间,应用程序运行良好。 w3wp.exe 进程通常使用 5-20% 的 CPU 和大约 200MB 的 RAM。 CPU和RAM在正常使用情况下略有波动,但没有异常。

然而,当我们开始遇到问题时,RAM 会急剧攀升,而 CPU 则稳定在 98%(或尽可能多)。该站点变得无响应,需要重新启动 IIS。在这种情况下重置应用程序池没有任何作用,需要完整的 IIS 重新启动。

它不会发生在夜间(不使用)。当站点负载不足时,这种情况发生得更多,但在非高峰时段也发生过。

解决这个问题的第一步是重现它。为了模拟负载,我们开始使用 JMeter 来模拟使用情况。我们的加载脚本基于崩溃时的实际使用情况。使用 JMeter,我们可以提高使用率(崩溃期间负载的 2-3 倍),但该站点表现良好。 CPU 上升,网站确实变得缓慢,但内存使用合理,没有任何问题。

有没有人有关于如何在非生产环境中重现这样的问题的任何提示?我们真的很想重现错误,确定解决方案,然后再次测试以确保我们已经解决了它。在这个过程中,我们发现了一些我们改进的小东西可能会解决问题,但如果我们能重现问题并测试改进的版本,我真的会更有信心。

非常感谢任何工具、技术或理论!

最佳答案

您可以在 this blog entry 找到有关解决此类问题的一些信息。 .她的博客通常是一个很好的调试资源。

关于asp.net - 在非生产环境中复制与负载相关的崩溃,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9501/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com