负载均衡:通过反向代理来实现

Nginx的七层代理和四层代理:

七层是最常用的反向代理方式,只能配置在nginx配置文件的http模块当中 ;配置的方法名称为:upstream模块,不能写在server中也不能写在location中,在http模块当中是独立的一个配置

七层代理:代理的是http的请求和响应

客户端————发起http请求————七层代理(代理服务器)————代理服务器转发http请求到内部的一组服务器(web集群)

        过程中客户端并不知道请求的是代理服务器还是内部服务器,而且通过代理服务器隐藏了内部服务器的ip

        实际上,客户端访问的是代理服务器;请求通过代理服务器转发给web服务器,web服务器响应;

四层代理:

是基于tcp/ip协议层的代理转发方式;可以实现基于IP地址和端口进行负载均衡转发

四层代理无法获取http请求当中的URL信息,只能对tcp/udp数据包进行转发;也就是对流量转发

配置方法:stream;stream不能配置在http模块中,配置在全局当中,是属于一个独立的模块,不属于其他任何模块

1.四层代理和七层代理的区别(面试***)

        四层代理是基于IP地址和端口号进行的,只负责转发请求,速度较快;

        四层代理不能进行流量控制,也没办法对内容进行过滤

        七层代理是通过http请求,四层走的是tcp/udp的数据包,转发的是流量

        七层代理的特点:基于http协议进行;可以对请求进行深入地解析和处理(流量控制、内容的过滤)

        四层:适用于需要高效处理大量连接请求的场景: TCP 和 UDP 协议的负载均衡;

        七层:适用于对请求进行精确处理和控制的场景:Web 应用程序的负载均衡

2.四层和七层哪个速度更快(面试)

        四层代理相比七层更快;

        四层只是流量转发,不能对请求进行解析和控制;快

        四层代理是通过内核转发的流量;快

        七层代理,需要对请求进行处理和解析;慢

        七层的 访问控制、流量处理 是通过用户态进行的;慢

        七层代理可以提供更高级的服务和用户体验

正向代理:

        正向代理是面向客户端的;当客户端的IP地址被web服务器禁止访问后,(客户端)可以通过代理服务器去访问web服务器;

        web服务器只会知道是代理服务器的ip访问的它,而不知道是客户端

proxy_pass #配置代理服务器访问的地址;只能写在location模块中

应用:

正向代理更多的用在公司内网,公司内员工的主机都通过一个代理服务器访问互联网,

而互联网上被访问的服务器,只知道代理服务器的ip,不知道公司内员工的ip,主要作用:加速,翻墙

反向代理:***

        客户端直接访问代理服务器

        两者都是通过客户端访问代理服务器,代理服务器转发请求或者流量到后端服务器,后端的web服务器会有多台,用户并不知道最终访问的是哪一台服务器

        负载均衡具有:高可用、可扩展、提高可维护性

工作中你是怎么做反向代理的(面试*)

反向代理就是负载均衡,根据场景的并发量来确定负载均衡的算法

并发量小:可以使用默认轮询,配合最小连接数使用即可

高并发:ip_hash或者url_hash来实现,访问一次之后,就不会再切换后端web服务器,下一次访问的就是缓存,速度快、后台web服务器的请求压力也会变小

upstream        基于http实现负载均衡;反向代理;

特点:

http请求的负载均衡方式

没有缓存

默认为轮询算法

1.轮询算法(rr)

会将请求轮流分配给后端服务器,轮询算法适用于 web服务器 处理能力相近的情况;默认算法,可以不加

vim /usr/local/nginx/conf/nginx.conf

#gzip on;

upstream ky30 {

server 192.168.220.20;

server 192.168.220.30;

#指定通过代理服务器10,会把http的请求转发到20或者30上

}

location / {

root html;

index index.html index.htm;

proxy_pass http://ky30;

}

2.加权轮询算法

        建立在轮询算法的基础之上,通过给不同的web服务器分配权重,让处理能力更强的服务器可以分配到更多的请求;

        虽然配置了权重值,但是轮询的结果未必准确

vim /usr/local/nginx/conf/nginx.conf

#keepalive_timeout 0;

keepalive_timeout 65;

#gzip on;

upstream ky30 {

server 192.168.220.20 weight=2;

server 192.168.220.30 weight=3;

#通过代理服务器10,转发http请求时,网权重高的服务器上转发的次数会更多,权重少的转发就少

}

3.ip_hash算法

        会根据IP地址计算出一个hash值,使用ip_hash算法,同一个客户端的请求会被分配到同一个后端服务器,可以保证会话的稳定性;

        如果后端服务器的数量发生变化,hash值会重新计算,请求的服务器也会发生变化

4.最少连接数算法least_conn

        可以轮询,会将请求发送到当前连接数最少的web服务器

        主要适用于后端服务器处理 任务耗时不同 的情况,避免了所有请求集中在处理能力更强的后端服务器上,可以和加权轮询配合使用

5.url_hash算法

根据uri地址计算hash值;使用url_hash,相同请求的uri会分配到同一个后端web服务器

vim /usr/local/nginx/conf/nginx.conf

#gzip on;

upstream ky30 {

hash $request_uri consistent;

server 192.168.220.20 weught=2;

server 192.168.220.30 weight=3;

}

负载均衡的核心就是各类算法

        小场景:并发量很小,默认算法就可以满足适应条件

        中等:后端web服务器的处理能力有差异:加权轮询,和最小连接数配合使用

        大型并发:使用ip_hash或者url_hash;第一次请求之后会有本地缓存,可以提高后续访问速度,因为hash算法的原因,请求的后台web服务器不会发生变化;减轻了后台服务器的请求压力

        ip_hash;后端服务器数量发生变化,请求的服务器也会发生变化

        url_hash;请求的地址发生变化,请求的服务器也可能会发生变化

stream

默认不带轮询;可以使用的轮询方式

算法:除不支持url_hash外,其他与upstream相同

实验

1.七层:

http        IP地址

http        域名

2.四层:

stream

好文链接

评论可见,请评论后查看内容,谢谢!!!
 您阅读本篇文章共花了: