gpt4 book ai didi

ruby-on-rails-3 - 在Nginx + Unicorn上加载时出现严重的网关错误(Rails 3应用)

转载 作者:行者123 更新时间:2023-12-04 05:04:04 26 4
gpt4 key购买 nike

我有一个在云平台上的nginx和 unicorn 上运行的Rails(3.2)应用程序。该“盒子”在Ubuntu 12.04上运行。

当系统负载约为70%或更高时,nginx突然(看似随机)开始抛出502 Bad gateway errors ;当负载较小时,没有什么比它喜欢的了。我尝试了多种内核(4、6、10 –我可以“更改硬件”,就像在云平台上一样),情况总是一样的。 (CPU负载类似于系统负载,用户空间为55%,其余的是系统和被盗的,具有足够的可用内存,无需交换。)

502通常成批出售,但并非总是如此。

(我每个内核运行一个 unicorn worker ,一个或两个Nginx worker 。在10个内核上运行时,请参阅以下配置的相关部分。)

我真的不知道如何跟踪这些错误的原因。我怀疑这可能与无法及时服务的 unicorn worker 有关(但是?),这看起来很奇怪,因为他们似乎没有使CPU饱和,而且我看不出他们为什么要等待IO(但我不知道)也不知道如何确保这一点)。

能否请我帮忙寻找原因?

unicorn 配置(unicorn.rb):

worker_processes 10
working_directory "/var/www/app/current"
listen "/var/www/app/current/tmp/sockets/unicorn.sock", :backlog => 64
listen 2007, :tcp_nopush => true
timeout 90
pid "/var/www/app/current/tmp/pids/unicorn.pid"
stderr_path "/var/www/app/shared/log/unicorn.stderr.log"
stdout_path "/var/www/app/shared/log/unicorn.stdout.log"
preload_app true
GC.respond_to?(:copy_on_write_friendly=) and
GC.copy_on_write_friendly = true
check_client_connection false

before_fork do |server, worker|
... I believe the stuff here is irrelevant ...
end
after_fork do |server, worker|
... I believe the stuff here is irrelevant ...
end

和ngnix配置:
/etc/nginx/nginx.conf:
worker_processes 2;
worker_rlimit_nofile 2048;
user www-data www-admin;
pid /var/run/nginx.pid;
error_log /var/log/nginx/nginx.error.log info;

events {
worker_connections 2048;
accept_mutex on; # "on" if nginx worker_processes > 1
use epoll;
}

http {
include /etc/nginx/mime.types;
default_type application/octet-stream;
log_format main '$remote_addr - $remote_user [$time_local] "$request" '
'$status $body_bytes_sent "$http_referer" '
'"$http_user_agent" "$http_x_forwarded_for"';
access_log /var/log/nginx/access.log main;
# optimialization efforts
client_max_body_size 2m;
client_body_buffer_size 128k;
client_header_buffer_size 4k;
large_client_header_buffers 10 4k; # one for each core or one for each unicorn worker?
client_body_temp_path /tmp/nginx/client_body_temp;

include /etc/nginx/conf.d/*.conf;
}
/etc/nginx/conf.d/app.conf:
sendfile on;
tcp_nopush on;
tcp_nodelay off;
gzip on;
gzip_http_version 1.0;
gzip_proxied any;
gzip_min_length 500;
gzip_disable "MSIE [1-6]\.";
gzip_types text/plain text/css text/javascript application/x-javascript;

upstream app_server {
# fail_timeout=0 means we always retry an upstream even if it failed
# to return a good HTTP response (in case the Unicorn master nukes a
# single worker for timing out).
server unix:/var/www/app/current/tmp/sockets/unicorn.sock fail_timeout=0;
}

server {
listen 80 default deferred;
server_name _;
client_max_body_size 1G;
keepalive_timeout 5;
root /var/www/app/current/public;

location ~ "^/assets/.*" {
...
}

# Prefer to serve static files directly from nginx to avoid unnecessary
# data copies from the application server.
try_files $uri/index.html $uri.html $uri @app;

location @app {
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
proxy_set_header Host $http_host;
proxy_redirect off;

proxy_pass http://app_server;

proxy_connect_timeout 90;
proxy_send_timeout 90;
proxy_read_timeout 90;

proxy_buffer_size 128k;
proxy_buffers 10 256k; # one per core or one per unicorn worker?
proxy_busy_buffers_size 256k;
proxy_temp_file_write_size 256k;
proxy_max_temp_file_size 512k;
proxy_temp_path /mnt/data/tmp/nginx/proxy_temp;

open_file_cache max=1000 inactive=20s;
open_file_cache_valid 30s;
open_file_cache_min_uses 2;
open_file_cache_errors on;
}
}

最佳答案

搜寻了在nginx错误日志中找到的表达式后,事实证明这是一个已知问题,与nginx无关,与unicorn无关,并且 Root 于OS(linux)设置中。

问题的核心是套接字积压太短。有多种考虑因素(应该是要尽快发现集群成员故障还是要让应用程序继续增加负载限制)。但是无论如何,listen :backlog必须进行调整。

我发现在我的情况下,一个listen ... :backlog => 2048就足够了。 (我没有做太多实验,尽管有个不错的技巧可以通过在两个不同的待办事项和较长的备份之间在nginx和unicorn之间进行通信来实现两个套接字;然后在nginx日志中查看较短的队列失败的频率。)请注意,这不是科学计算和YMMV的结果。

但是请注意,许多OS-es(大多数Linux发行版,包括Ubuntu 12.04)对套接字积压大小(低至128)的操作系统级别默认限制要低得多。

您可以如下更改操作系统限制(成为root用户):

sysctl -w net.core.somaxconn=2048
sysctl -w net.core.netdev_max_backlog=2048

将它们添加到 /etc/sysctl.conf中以使更改永久生效。 (无需重新启动 /etc/sysctl.conf即可重新加载 sysctl -p。)

有人提到您可能还必须增加一个进程可以打开的最大文件数(为了保持永久性,请使用 ulimit -n/etc/security/limits.conf)。由于其他原因,我已经这样做了,所以我无法确定它是否有所作为。

关于ruby-on-rails-3 - 在Nginx + Unicorn上加载时出现严重的网关错误(Rails 3应用),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15477740/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com