Nginx怎么使用ngx_http_upstream_module实现负载均衡功能

    负载均衡介绍

    什么是负载均衡

    负载均衡(Load Balance),意思是将负载(工作任务,访问请求)进行平衡、分摊到多个操作单元(服务器,组件)上进行执行。

    为什么需要负载均衡

    当单台web服务器直接面向用户,可能要承载着大量的并发请求,单台服务器可能难以负荷,我们需要使用多台web服务器组成一个集群,利用Nginx负载均衡功能,将请求分发给不同的后端服务器,实现负载的流量分发,提升整体性能、以及系统的容灾能力。

    • 负载均衡与代理有什么区别

    代理是代理一台服务器基于URI调度,调度到不同功能的应用节点

    负载均衡是将客户端请求通过proxy_pass代理至一组upstream资源池

    • 实现负载均衡场景

    实现负载均衡功能需要使用两个模块:

    • proxy_pass:代理模块

    • upstream:虚拟资源池

    示例:一个官方的的负载均衡展示

    upstream backend {
        server backend1.example.com       weight=5;
        server backend2.example.com:8080;
        server unix:/tmp/backend3;
    
        server backup1.example.com:8080   backup;
        server backup2.example.com:8080   backup;
    }
    
    server {
        location / {
            proxy_pass http://backend;
        }
    }

    示例:自己完成一个小例子

    upstream node {
        server 192.168.10.3:80;
        server 192.168.10.4:80;
    }
    server {
        listen 80;
        server_name www.yyang.com;
        location / {
            proxy_pass http://node;
            include prxoy_params;
        }
    }

    负载均衡调度算法

    轮询调度

    按顺序逐一分配到不同的后端节点,也是默认算法。(简单来说就是1:1:1)

    加权轮询
    考虑到不同服务器的性能不同,给予节点不同的权值,使其接收到相应的权值请求数

    server 192.168.10.3:80 weight=3;
    server 192.168.10.4:80 weight=1;

    以上这个例子是说每4个请求会分配给10.3三个,10.4一个,以此循环。

    ip_hash

    根据用户请求的IP,对该IP进行hash运算,根据运算的值将请求分配给后端特定的一台节点进行处理。

    取值范围为ipv4地址的前三个8位或ipv6的整个地址作为哈希键,确保来自从一个客户端的IP始终传递给同一台服务器,除非次服务器不可用。简单点说,172.16.20.1和172.16.20.2的前三组数字是一样的(都是172.16.20)

    ip_hash运算公式:hash(ip)%node_counts=index

    ip_hash带来的问题:
    大量同一IP的请求会造成某个节点流量过大
    如果临时下线一台节点,会重新计算hash值,建议使用down状态

    示例:注意ip_hash与权重不可同时使用

    ip_hash;
    server 192.168.10.3:80;
    server 192.168.10.4:80;

    一致性hash

    为了避免上述问题,所以诞生了一致性hash,使用取模的方式,但不对服务器节点数量取模,而是对2的32次方取模,hash函数值为0~2^32-1。(形成一个虚拟圆环,用户请求会发给顺时针相邻的节点)
    有一个问题:如果后端节点较少可能会造成数据倾斜,所以一致性hash引入了虚拟节点机制,即对每个服务器计算多个哈希,每个计算结果位置都放置一个虚拟节点。
    如果我们想使用ip_hash,但是计算公式使用一致性hash,该怎么做?

    hash $remote_addr consistent;
    server 192.168.10.3:80;
    server 192.168.10.4:80;

    url_hash

    根据用户的url进行hash取模,根据运算值,将请求分配给一台特定的后端服务器。

    1.用户请求nginx负载均衡,通过url算法,请求调度至cache1
    2.cache1没有数据,会向后端获取,返回数据,并将数据缓存
    3.当其他用户访问相同url时,调度器依然会调度到cache1节点
    4.cache1会直接将数据返回

    hash $request_uri consistent;
    server 192.168.10.3:80;
    server 192.168.10.4:80;

    least_conn

    哪台服务器的连接数最少,就将请求调度到这台服务器

    least_conn;
    server 192.168.10.3:80;
    server 192.168.10.4:80;

    负载均衡后端节点状态

    down

    将服务器节点标记为不可用状态,一般用于停机维护。

    server 192.168.10.3:80 down;
    server 192.168.10.4:80;

    backup

    备用节点,正常情况不会调度到此节点;当正常工作节点全部不可用时,会启用此节点;当节点恢复时此节点会继续恢复备用状态。

    server 192.168.10.3:80;
    server 192.168.10.4:80;
    server 192.168.10.5:80 backup;

    max_conns

    用来限制每个后端节点接收到的最大的TCP连接数,如果超出限制就会抛出错误。

    server 192.168.10.3:80 max_conns=10;
    server 192.168.10.4:80 max_conns=10;

    一台可以连接10.两台是20,超过20就会出错。

    keepalived

    与后端服务器激活缓存,也就是长链接,提升网站吞吐量。
    默认不启用此功能,当有请求时,会建立连接,维护连接,关闭连接,所以会存在网络消耗;但是如果所有连接都缓存了,当连接空闲了又会占用其他系统资源,所以可以使用keepalived参数。

    server 192.168.10.3:80;
    server 192.168.10.4:80;
    
    keepalived 32;   # 最大空闲连接数的个数
    keepalived_timeout 100s; # 空闲连接的超时时间
    
    # 需要配合以下两个参数使用
    
    proxy_http_version 1.1;
    proxy_set_header connection "";

    max_fails与fail_timeout

    max_fails=2:服务器通信失败两次,认为服务器不可用
    fail_timeout=5s:服务器通信失败后,每5秒探测一次服务器是否恢复正常。
    在fail_timeout设定时间内,与服务器连接失败次数达到max_fails数量,则认为服务器不可用。
    如果不设置的话默认是探测一次,间隔10s。

    server 192.168.10.3:80 max_fails=2 fail_timeout=5s;
    server 192.168.10.4:80 max_fails=2 fail_timeout=5s;

    以上就是Nginx怎么使用ngx_http_upstream_module实现负载均衡功能的详细内容,更多请关注其它相关文章!