05 . Nginx的反向代理与负载均衡

Nginx负载均衡

客户端的访问都被代理到后端的一台服务器上，最终会出现性能瓶颈，从而导致效率降低，前端用户的访问速度急速下降，要解决这个问题就需要添加多台httpd，同时承受大量并发连接，每台服务器接收的并发连接降低了，效率就高了，nginx作为代理，在收到客户端的请求时，会分发到不同的后端服务器，但是nginx收到请求之后会分配到那个服务器之上，有什么规律和需求，就需要用调度算法来分配.

upstream语法

# upstream的定义必须在server{..}外定义  
upstream <组名称> {  
# [调度算法];  
server IP:port [weight=<number>] [max_fails=<number>] [fail_timeout=<number>];  
server IP:port [weight=<number>] [max_fails=<number>] [fail_timeout=<number>];  
server IP:port [weight=<number>] [max_fails=<number>] [fail_timeout=<number>];  
}  
  
weight=<number>             # 设置服务器的权重值  
max_fails=<number>          # 检测失败的次数  
fail_timeout=<number>       # 检测的周期，单位为秒，就是每次检测的间隔时间  
max_conns										# 限制最大的接受连接数
backup  										# 预留的备份服务器
down												# 当前的server暂时不参与负载均衡

  
location / {  
 proxy_pass http://<组名称>  
}

调度算法

调度算法	概述
轮训	按时间顺序逐一分配到不同的后端服务器(默认)
weight	加权轮训,weight值越大,分配到的访问几率越高
Ip_hash	每个请求按访问IP的hash结果分配,这样来自同一IP的固定访问一个后端服务器
Url_hash	按照访问URL的hash结果来分配请求,是每个URL定向到一个后端服务器
Least_conn	最少连接数,那个机器连接数少就分发
hash关键数值	hash自定义key的key

rr

默认，支持为后端服务器设置权重(weight),默认是1.

upstream linuxidc{
      server 10.0.0.77 weight=5;
      server 10.0.0.88 weight=10;
}

ip_hash

相同IP地的客户端请求，Nginx会代理到一台后端服务器，方便做网站的session。

upstream favresin{
      ip_hash;
      server 10.0.0.10:8080;
      server 10.0.0.11:8080;
}

least_conn

最少连接，nginx会自动检测后端服务器连接数，代理到最少连接的服务器上. 我们知道轮训算法是把请求平均的转发到各个后端，使他们负载大致相同,这有个前提，就是每个请求所占用的后端时间差不多，如果有些请求时间很长，会导致所有的后端负载较高，这种情况下，把请求转发给连接数较少的后端，能够达到更好的负载均衡效果，这就是least_conn算法. least_conn算法很简单，首先便利后端集群，比较每个后端的conns/weight,选取该值最小的后端. 如果有多个conns/weight值同为最小的，那么对他们采用加权轮训算法. https://blog.csdn.net/zhangskd/article/details/50242241

fair

按后端服务器的响应时间来分配请求，响应时间短的优先分配，与weight分配策略类似.

upstream favresin{     
      server 10.0.0.10:8080;
      server 10.0.0.11:8080;
      fair;
}

url_hash

按访问url的hash结果分配请求，使每个url定向到一个后端服务器，后端服务器为缓存时比较有效。

在upstream中加入hash语句，server语句中不能写入weight等其他参数，hash_method是使用的hash算法.

upstream resinserver{
      server 10.0.0.10:7777;
      server 10.0.0.11:8888;
      hash $request_uri;
      hash_method crc32;
}

upstream:      #  还可以为每个设备设置状态值，这些状态值的含义分别如下：
down:          # 表示单前的server暂时不参与负载.
weight:        # 默认为1.weight越大，负载的权重就越大。
max_fails:     
# 允许请求失败的次数默认为1.当超过最大次数时，返回proxy_next_upstream 模块定义的错误.
fail_timeout:  # max_fails次失败后，暂停的时间。
backup: 
# 其它所有的非backup机器down或者忙的时候，请求backup机器。所以这台机器压力会最轻。

# 定义负载均衡设备的Ip及设备状态
upstream bakend{ 
      ip_hash;
      server 10.0.0.11:9090 down;
      server 10.0.0.11:8080 weight=2;
      server 10.0.0.11:6060;
      server 10.0.0.11:7070 backup;
}

正向代理

正向代理类似一个跳板机，代理访问外部资源 example 1:

上不了google，可以找一个代理服务器，代理上google,在浏览器中设置相应的代理地址即可，这样由代理去谷歌返回数据，再返回给我们，这样我们就能访问谷歌了：选项——> 常规——> 网络代理——> 设置——> 手动配置代理——> 写好ip地址端口即可.

example 2

内网服务器无法上外网，可以找能上外网的服务器作为代理，代替上网即可.

# 正向代理的用途:
        # (1).访问原来无法访问的资源,如google.
        # (2).可以做缓存，加速访问资源.
        # (3).对客户端访问授权，上网进行认证.
        # (4).代理可以记录用户访问记录(上网行为管理)，对外隐藏用户信息.

正向反向代理区别

# 正向代理代理对象是客户端
# 反向代理代理对象是服务端

Nginx代理配置语法

Syntax: proxy_pass URL;
Default:    —
Context:    location, if in location, limit_except
http://localhost:8000/uri/
http://39.108.140.0:8000/uri/
http://unix:/tmp/backend.socket:/uri/
      
# 尽可能收集所有头请求, 
Syntax: proxy_buffering on | off;
Default:    
proxy_buffering on;
Context:    http, server, location
# 扩展:
proxy_buffer_size 
proxy_buffers 
proxy_busy_buffer_size    

# 跳转重定向
Syntax: proxy_redirect default;
proxy_redirect off;proxy_redirect redirect replacement;
Default:    proxy_redirect default;
Context:    http, server, location
  
# 头信息
Syntax: proxy_set_header field value;
Default:    proxy_set_header Host $proxy_host;
            proxy_set_header Connection close;
Context:    http, server, location
# 扩展: 
proxy_hide_header
proxy_set_body

# 代理到后端的TCP连接超时
Syntax: proxy_connect_timeout time;
Default: proxy_connect_timeout 60s;
Context: http, server, location
# 扩展
proxy_read_timeout  # 以及建立
proxy_send_timeout  # 服务端请求完, 发送给客户端时间

# Proxy常见配置项具体配置如下
vim /etc/nginx/proxy_params
proxy_redirect default;
proxy_set_header Host $http_host;
proxy_set_header X-Real-IP $remote_addr;
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
proxy_connect_timeout 30;
proxy_send_timeout 60;
proxy_read_timeout 60;
proxy_buffer_size 32k;
proxy_buffering on;
proxy_buffers 4 128k;
proxy_busy_buffers_size 256k;
proxy_max_temp_file_size 256k;
//具体location实现
location / {
    proxy_pass http://127.0.0.1:8080;
    include proxy_params;
}

反向代理

反向代理(Reverse Proxy)实际运行方式是指以代理服务器来接收internet上的连接请求，然后将请求转发给内部网络上的服务器，并将从服务器上得到的结果返回给internet上连接的客户端，此时代理服务器对外就表现为一个服务器.(为服务器做代理)

反向代理的用途:

保证内网的安全，组织web攻击，大型网站，通常将反向代理作为公网访问地址，web服务器就是内网.

负载均衡,通过反向代理服务器来优化网站的负载.

总结

# 1. 正向代理即是客户端代理，代理客户端，服务端不知道实际发起请求的客户端.    (买票的黄牛)
# 2. 反向代理即是服务端代理，代理服务器，客户端不知道实际提供服务的服务器.  （租房的代理）

Proxy配置实例

example 1:

客户端通过http://39.108.140.0- proxy主机访问nginx时，以本地页面响应；通过http://39.108.140.0/forum ,proxy主机访问时，代理到后端服务器49.233.69.195 - rearend主机上

vim /etc/nginx/conf.d/default.conf
    location /forum {
        proxy_pass http://49.233.69.195/;
    }

如果location后写自定义的URI地址，在做反向代理时，必须要指定路径; 如果定义location时候加入了~ ~* 这样的模式匹配字符，后面跟了路径，proxy_pass在写时，只能写到服务器地址上，也就是不允许写IP后面的/，否则报语法错误.

location ~ /discuz {
          proxy_pass http://49.233.69.195;
      }
echo 123 > /usr/share/nginx/html/discuz/index.html
# elinks --dump 39.108.140.0/discuz

此处要注意，如果是按照forum的写法，那么根目录没有forum也会代理成功，但是如果按照discuz写法，就算有discuz目录，没有相应 123 # 文件也会报错403,404之类错误.

systemctl reload nginx
echo you-men > /usr/share/nginx/html/index.html
echo ten-xun > /usr/share/nginx/html/index.html
elinks 39.108.140.0 --dump
   you-men
elinks --dump 39.108.140.0/forum
   ten-xun

example 2:

客户端访问http://39.108.140.0/discuz,代理到后端服务器http://49.233.69.195的bbs目录下

location  /discuz {
    proxy_pass http://49.233.69.195/bbs;
}
echo ten-xun_bbs > /usr/share/nginx/html/bbs/index.html
elinks --dump 39.108.140.0/discuz
   ten-xun_bbs

example 3:

配置nginx不再响应客户端访问请求，所有访问请求全部代理到后端服务器

location / {
        root   /usr/share/nginx/html;
        index  index.html index.htm;
}

将以上location注释，换成匹配到什么目录就代理到什么后端服务器相关的location

Nginx的四层负载均衡

什么是四层负载均衡?

四层负载均衡是基于传输层协议包来封装的（如：TCP/IP），那我们前面使用到的七层是指的应用层，他的组装在四层的基础之上，无论四层还是七层都是指的OSI网络模型。

四层负载均衡应用场景

# 四层+七层来做负载均衡，四层可以保证七层的负载均衡的高可用性；如：nginx就无法保证自己的服务高可用，需要依赖LVS或者keepalive。

# 如：tcp协议的负载均衡，有些请求是TCP协议的（mysql、ssh），或者说这些请求只需要使用四层进行端口的转发就可以了，所以使用四层负载均衡。

小结

# 1、四层负载均衡仅能转发TCP/IP协议、UDP协议、通常用来转发端口，如：tcp/22、udp/53；
# 2、四层负载均衡可以用来解决七层负载均衡端口限制问题；（七层负载均衡最大使用65535个端口号）
# 3、四层负载均衡可以解决七层负载均衡高可用问题；（多台后端七层负载均衡能同事的使用）
# 4、四层的转发效率比七层的高得多，但仅支持tcp/ip协议，不支持http和https协议；
# 5、通常大并发场景通常会选择使用在七层负载前面增加四层负载均衡。

Nginx配置四层负载均衡

注意

1 . 记得编译加上--with-stream模块 2 . 在nginx.conf默认配置文件里面，默认没有stream的配置。stream模块的配置跟http配置是同级的，因此要注意不要写到http里面。

配置数据测试目录

mkdir -p /nginx_test/web{1..2}
echo web1 > /nginx_test/web1/index.html 
echo web2 > /nginx_test/web2/index.html

配置nginx

cat conf/nginx.conf
worker_processes  1;
events {
    worker_connections  1024;
}
stream {
    log_format  proxy '$remote_addr $remote_port - [$time_local] $status $protocol '
                  '"$upstream_addr" "$upstream_bytes_sent" "$upstream_connect_time"' ;
    access_log /var/log/nginx/proxy.log proxy;
    upstream lb {
            server 121.36.43.223:81 weight=5 max_fails=3 fail_timeout=30s;
            server 121.36.43.223:82 weight=5 max_fails=3 fail_timeout=30s;
    }

    server {
            listen 80;
            proxy_connect_timeout 3s;
            proxy_timeout 3s;
            proxy_pass lb;
    }
}
http {
    include       mime.types;
    default_type  application/octet-stream;
    sendfile        on;
    keepalive_timeout  65;
    server {
        listen       81;
        server_name  localhost;
        location / {
            root   /nginx_test/web1;
            index  index.html index.htm;
        }
    }

    server {
        listen       82;
        server_name  localhost;
        location / {
            root   /nginx_test/web2;
            index  index.html index.htm;
        }   
    }
}

[root@nginx_test ~]# curl 121.36.43.223
web1
[root@nginx_test ~]# curl 121.36.43.223
web2
[root@nginx_test ~]# curl 121.36.43.223
web1

记录后端服务器真实客户端IP

配置Proxy_set_header,实现后端服务器记录真实的客户端IP

vim /etc/nginx/conf.d/default.conf
    location /forum {
        proxy_pass http://49.233.69.195/;
        proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for; 
	# 后端真实服务器是nginx时使用此行配置;

        proxy_set_header x-real-ip $remote_addr; 
	# 后端真实服务器为httpd时使用
        # 如果后端真实服务器是httpd,需要修改httpd的配置文件
systemctl reload nginx

如果是httpd需要修改一下配置文件 vim /etc/httpd/conf/httpd.conf LogFormat "%{x-real-ip}i %l %u %t "%r" %>s %b "%{Referer}i" " %{User-Agent}i"" combined }

39.108.140.0 - - [01/Nov/2019:19:31:45 +0800] "GET / HTTP/1.0" 200 8 "-" "ELinks/0.12pre6 (textmode; Linux; -)" "-"                    
#没有加proxy_set_header后端服务器的日志

..39.108.140.0 - - [01/Nov/2019:19:29:26 +0800] "GET / HTTP/1.0" 200 8 "-" "ELinks/0.12pre6 (textmode; Linux; -)" "47.92.24.137"   
#加了proxy_set_header后端服务器的日志