05 . Nginx的反向代理与负载均衡

时间:2022-07-25
本文章向大家介绍05 . Nginx的反向代理与负载均衡,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

Nginx负载均衡

客户端的访问都被代理到后端的一台服务器上,最终会出现性能瓶颈,从而导致效率降低,前端用户的访问速度急速下降,要解决这个问题就需要添加多台httpd,同时承受大量并发连接,每台服务器接收的并发连接降低了,效率就高了,nginx作为代理,在收到客户端的请求时,会分发到不同的后端服务器,但是nginx收到请求之后会分配到那个服务器之上,有什么规律和需求,就需要用调度算法来分配.

upstream语法
# upstream的定义必须在server{..}外定义  
upstream <组名称> {  
# [调度算法];  
server IP:port [weight=<number>] [max_fails=<number>] [fail_timeout=<number>];  
server IP:port [weight=<number>] [max_fails=<number>] [fail_timeout=<number>];  
server IP:port [weight=<number>] [max_fails=<number>] [fail_timeout=<number>];  
}  
  
weight=<number>             # 设置服务器的权重值  
max_fails=<number>          # 检测失败的次数  
fail_timeout=<number>       # 检测的周期,单位为秒,就是每次检测的间隔时间  
max_conns										# 限制最大的接受连接数
backup  										# 预留的备份服务器
down												# 当前的server暂时不参与负载均衡

  
location / {  
 proxy_pass http://<组名称>  
}  

调度算法

调度算法

概述

轮训

按时间顺序逐一分配到不同的后端服务器(默认)

weight

加权轮训,weight值越大,分配到的访问几率越高

Ip_hash

每个请求按访问IP的hash结果分配,这样来自同一IP的固定访问一个后端服务器

Url_hash

按照访问URL的hash结果来分配请求,是每个URL定向到一个后端服务器

Least_conn

最少连接数,那个机器连接数少就分发

hash关键数值

hash自定义key的key

rr

默认,支持为后端服务器设置权重(weight),默认是1.

upstream linuxidc{
      server 10.0.0.77 weight=5;
      server 10.0.0.88 weight=10;
}
ip_hash

相同IP地的客户端请求,Nginx会代理到一台后端服务器,方便做网站的session。

upstream favresin{
      ip_hash;
      server 10.0.0.10:8080;
      server 10.0.0.11:8080;
}
least_conn

最少连接,nginx会自动检测后端服务器连接数,代理到最少连接的服务器上. 我们知道轮训算法是把请求平均的转发到各个后端,使他们负载大致相同,这有个前提,就是每个请求所占用的后端时间差不多,如果有些请求时间很长,会导致所有的后端负载较高,这种情况下,把请求转发给连接数较少的后端,能够达到更好的负载均衡效果,这就是least_conn算法. least_conn算法很简单,首先便利后端集群,比较每个后端的conns/weight,选取该值最小的后端. 如果有多个conns/weight值同为最小的,那么对他们采用加权轮训算法. https://blog.csdn.net/zhangskd/article/details/50242241

fair

按后端服务器的响应时间来分配请求,响应时间短的优先分配,与weight分配策略类似.

upstream favresin{     
      server 10.0.0.10:8080;
      server 10.0.0.11:8080;
      fair;
}
url_hash

按访问url的hash结果分配请求,使每个url定向到一个后端服务器,后端服务器为缓存时比较有效。

在upstream中加入hash语句,server语句中不能写入weight等其他参数,hash_method是使用的hash算法.

upstream resinserver{
      server 10.0.0.10:7777;
      server 10.0.0.11:8888;
      hash $request_uri;
      hash_method crc32;
}
upstream:      #  还可以为每个设备设置状态值,这些状态值的含义分别如下:
down:          # 表示单前的server暂时不参与负载.
weight:        # 默认为1.weight越大,负载的权重就越大。
max_fails:     
# 允许请求失败的次数默认为1.当超过最大次数时,返回proxy_next_upstream 模块定义的错误.
fail_timeout:  # max_fails次失败后,暂停的时间。
backup: 
# 其它所有的非backup机器down或者忙的时候,请求backup机器。所以这台机器压力会最轻。
# 定义负载均衡设备的Ip及设备状态
upstream bakend{ 
      ip_hash;
      server 10.0.0.11:9090 down;
      server 10.0.0.11:8080 weight=2;
      server 10.0.0.11:6060;
      server 10.0.0.11:7070 backup;
}

正向代理

正向代理类似一个跳板机,代理访问外部资源 example 1:

上不了google,可以找一个代理服务器,代理上google,在浏览器中设置相应的代理地址即可,这样由代理去谷歌返回数据,再返回给我们,这样我们就能访问谷歌了: 选项——> 常规——> 网络代理——> 设置——> 手动配置代理——> 写好ip地址端口即可.

example 2

内网服务器无法上外网,可以找能上外网的服务器作为代理,代替上网即可.

# 正向代理的用途:
        # (1).访问原来无法访问的资源,如google.
        # (2).可以做缓存,加速访问资源.
        # (3).对客户端访问授权,上网进行认证.
        # (4).代理可以记录用户访问记录(上网行为管理),对外隐藏用户信息.

正向反向代理区别

# 正向代理代理对象是客户端
# 反向代理代理对象是服务端
Nginx代理配置语法
Syntax: proxy_pass URL;
Default:    —
Context:    location, if in location, limit_except
http://localhost:8000/uri/
http://39.108.140.0:8000/uri/
http://unix:/tmp/backend.socket:/uri/
      
# 尽可能收集所有头请求, 
Syntax: proxy_buffering on | off;
Default:    
proxy_buffering on;
Context:    http, server, location
# 扩展:
proxy_buffer_size 
proxy_buffers 
proxy_busy_buffer_size    

# 跳转重定向
Syntax: proxy_redirect default;
proxy_redirect off;proxy_redirect redirect replacement;
Default:    proxy_redirect default;
Context:    http, server, location
  
# 头信息
Syntax: proxy_set_header field value;
Default:    proxy_set_header Host $proxy_host;
            proxy_set_header Connection close;
Context:    http, server, location
# 扩展: 
proxy_hide_header
proxy_set_body

# 代理到后端的TCP连接超时
Syntax: proxy_connect_timeout time;
Default: proxy_connect_timeout 60s;
Context: http, server, location
# 扩展
proxy_read_timeout  # 以及建立
proxy_send_timeout  # 服务端请求完, 发送给客户端时间

# Proxy常见配置项具体配置如下
vim /etc/nginx/proxy_params
proxy_redirect default;
proxy_set_header Host $http_host;
proxy_set_header X-Real-IP $remote_addr;
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
proxy_connect_timeout 30;
proxy_send_timeout 60;
proxy_read_timeout 60;
proxy_buffer_size 32k;
proxy_buffering on;
proxy_buffers 4 128k;
proxy_busy_buffers_size 256k;
proxy_max_temp_file_size 256k;
//具体location实现
location / {
    proxy_pass http://127.0.0.1:8080;
    include proxy_params;
}

反向代理

反向代理(Reverse Proxy)实际运行方式是指以代理服务器来接收internet上的连接请求,然后将请求转发给内部网络上的服务器,并将从服务器上得到的结果返回给internet上连接的客户端,此时代理服务器对外就表现为一个服务器.(为服务器做代理)

反向代理的用途:

保证内网的安全,组织web攻击,大型网站,通常将反向代理作为公网访问地址,web服务器就是内网.

  1. 负载均衡,通过反向代理服务器来优化网站的负载.

总结

# 1. 正向代理即是客户端代理,代理客户端,服务端不知道实际发起请求的客户端.    (买票的黄牛)
# 2. 反向代理即是服务端代理,代理服务器,客户端不知道实际提供服务的服务器.  (租房的代理)
Proxy配置实例
example 1:

客户端通过http://39.108.140.0- proxy主机访问nginx时,以本地页面响应;通过http://39.108.140.0/forum ,proxy主机访问时,代理到后端服务器49.233.69.195 - rearend主机上

vim /etc/nginx/conf.d/default.conf
    location /forum {
        proxy_pass http://49.233.69.195/;
    }

如果location后写自定义的URI地址,在做反向代理时,必须要指定路径; 如果定义location时候加入了~ ~* 这样的模式匹配字符,后面跟了路径,proxy_pass在写时,只能写到服务器地址上,也就是不允许写IP后面的/,否则报语法错误.

location ~ /discuz {
          proxy_pass http://49.233.69.195;
      }
echo 123 > /usr/share/nginx/html/discuz/index.html
# elinks --dump 39.108.140.0/discuz

此处要注意,如果是按照forum的写法,那么根目录没有forum也会代理成功,但是如果按照discuz写法,就算有discuz目录,没有相应 123 # 文件也会报错403,404之类错误.

systemctl reload nginx
echo you-men > /usr/share/nginx/html/index.html
echo ten-xun > /usr/share/nginx/html/index.html
elinks 39.108.140.0 --dump
   you-men
elinks --dump 39.108.140.0/forum
   ten-xun
example 2:

客户端访问http://39.108.140.0/discuz,代理到后端服务器http://49.233.69.195的bbs目录下

location  /discuz {
    proxy_pass http://49.233.69.195/bbs;
}
echo ten-xun_bbs > /usr/share/nginx/html/bbs/index.html
elinks --dump 39.108.140.0/discuz
   ten-xun_bbs
example 3:

配置nginx不再响应客户端访问请求,所有访问请求全部代理到后端服务器

location / {
        root   /usr/share/nginx/html;
        index  index.html index.htm;
}

将以上location注释,换成匹配到什么目录就代理到什么后端服务器相关的location

Nginx的四层负载均衡

什么是四层负载均衡?

四层负载均衡是基于传输层协议包来封装的(如:TCP/IP),那我们前面使用到的七层是指的应用层,他的组装在四层的基础之上,无论四层还是七层都是指的OSI网络模型。

四层负载均衡应用场景
# 四层+七层来做负载均衡,四层可以保证七层的负载均衡的高可用性;如:nginx就无法保证自己的服务高可用,需要依赖LVS或者keepalive。

# 如:tcp协议的负载均衡,有些请求是TCP协议的(mysql、ssh),或者说这些请求只需要使用四层进行端口的转发就可以了,所以使用四层负载均衡。

小结

# 1、四层负载均衡仅能转发TCP/IP协议、UDP协议、通常用来转发端口,如:tcp/22、udp/53;
# 2、四层负载均衡可以用来解决七层负载均衡端口限制问题;(七层负载均衡最大使用65535个端口号)
# 3、四层负载均衡可以解决七层负载均衡高可用问题;(多台后端七层负载均衡能同事的使用)
# 4、四层的转发效率比七层的高得多,但仅支持tcp/ip协议,不支持http和https协议;
# 5、通常大并发场景通常会选择使用在七层负载前面增加四层负载均衡。
Nginx配置四层负载均衡

注意

1 . 记得编译加上--with-stream模块 2 . 在nginx.conf默认配置文件里面,默认没有stream的配置。stream模块的配置跟http配置是同级的,因此要注意不要写到http里面。

配置数据测试目录
mkdir -p /nginx_test/web{1..2}
echo web1 > /nginx_test/web1/index.html 
echo web2 > /nginx_test/web2/index.html 
配置nginx
cat conf/nginx.conf
worker_processes  1;
events {
    worker_connections  1024;
}
stream {
    log_format  proxy '$remote_addr $remote_port - [$time_local] $status $protocol '
                  '"$upstream_addr" "$upstream_bytes_sent" "$upstream_connect_time"' ;
    access_log /var/log/nginx/proxy.log proxy;
    upstream lb {
            server 121.36.43.223:81 weight=5 max_fails=3 fail_timeout=30s;
            server 121.36.43.223:82 weight=5 max_fails=3 fail_timeout=30s;
    }

    server {
            listen 80;
            proxy_connect_timeout 3s;
            proxy_timeout 3s;
            proxy_pass lb;
    }
}
http {
    include       mime.types;
    default_type  application/octet-stream;
    sendfile        on;
    keepalive_timeout  65;
    server {
        listen       81;
        server_name  localhost;
        location / {
            root   /nginx_test/web1;
            index  index.html index.htm;
        }
    }

    server {
        listen       82;
        server_name  localhost;
        location / {
            root   /nginx_test/web2;
            index  index.html index.htm;
        }   
    }
}

[root@nginx_test ~]# curl 121.36.43.223
web1
[root@nginx_test ~]# curl 121.36.43.223
web2
[root@nginx_test ~]# curl 121.36.43.223
web1

记录后端服务器真实客户端IP

配置Proxy_set_header,实现后端服务器记录真实的客户端IP

vim /etc/nginx/conf.d/default.conf
    location /forum {
        proxy_pass http://49.233.69.195/;
        proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for; 
	# 后端真实服务器是nginx时使用此行配置;

        proxy_set_header x-real-ip $remote_addr; 
	# 后端真实服务器为httpd时使用
        # 如果后端真实服务器是httpd,需要修改httpd的配置文件
systemctl reload nginx

如果是httpd需要修改一下配置文件 vim /etc/httpd/conf/httpd.conf LogFormat "%{x-real-ip}i %l %u %t "%r" %>s %b "%{Referer}i" " %{User-Agent}i"" combined }

39.108.140.0 - - [01/Nov/2019:19:31:45 +0800] "GET / HTTP/1.0" 200 8 "-" "ELinks/0.12pre6 (textmode; Linux; -)" "-"                    
#没有加proxy_set_header后端服务器的日志

..39.108.140.0 - - [01/Nov/2019:19:29:26 +0800] "GET / HTTP/1.0" 200 8 "-" "ELinks/0.12pre6 (textmode; Linux; -)" "47.92.24.137"   
#加了proxy_set_header后端服务器的日志