LVS那些事
1998年,章文嵩博士成立了Linux Virtual Server的自由软件项目,进行Linux服务器集群的开发工作。
他的目标是:使用集群技术和Linux操作系统实现一个高性能、高可用的服务器,它具有很好的可伸缩性(Scalability)、可靠性(Reliability)和可管理性(Manageability)。
LVS到现在已经使用的非常广泛了,绝大部分国内的互联网企业用它来做四层的负载均衡组件。
我们分2-3篇博客来介绍LVS,包括从原理到实际的部署等方面。

LVS 做了什么工作?
当客户端向服务端发送请求,请求首先到LVS的服务器上。
- LVS选择一个服务器作为响应本次请求的真实服务器(Real Server)
- 将请求转发到 Real Server
- 将 Real Server 的回应转回客户端(某些模式下没有这一步)
归结起来,LVS做了两件很重要的事情:
- 挑选服务器
- 转发请求
下面就对这两个过程进行描述。在那之前,为了能更清楚的叙述,需要先认识一些名词:
Director
运行LVS的服务器,也叫 Virtual Server
LVS并不能直接提供服务,需要后端服务器提供真正的服务
RIP
实际提供服务的IPRS
实际提供服务的服务器(Real Server)
一台Director至少提供两个IP,一个用来对外提供服务(一般为公网),一个用来向后端服务器转发请求:
VIP
Virtual Server 对外提供服务的虚拟IP(Virtual IP)DIP
Virtual Server 用于转发的IP(Director IP)
向服务器发出请求的称为Client
CIP
客户端IP(Client IP)
转发请求
LVS在转发请求的方式一共有三种,各有优劣
1 Network Address Translation(VS/NAT)
全称 Virtual Network via Network Address Translation。
这种方法是通过NAT的方式来实现负载均衡。

如上图
- 当一个请求到达Director,其
源IP|目的IP
为CIP|VIP
; - Director将包的目的IP改为RIP,包地址为:
CIP|RIP
; - RS处理请求后,将结果返回,包地址为:
RIP|CIP
; - 返回的包经过Director时,将其包地址改为:
VIP|CIP
当包从RS返回时,其地址为RIP|CIP。如何保证包一定会经过Director呢?需要将所有的RS的Gateway设置为DIP。这需要DIP和RIP在同一个网段或Vlan中。
Full-NAT
这是VS/NAT方式的一个变种。原理是在转发到RS上时,将目标地址和原地址全部改写,回给客户端时再改回去。这样的话DIP和RIP可以不在一个网段上,可以实现跨机房,或者异地容灾。
缺点
这种方式的缺点是:request和response全部要经过Director,当RS的数量很多,或者请求量很大时,Director会变成性能瓶颈。
2 Direct Routing(VS/DR)
全称:Virtual Server via Direct Routing。
这是目前较为常用的一种模式,可以避免VS/NAT出现的Director性能问题。

- 请求到达Director,将目标MAC改为RS的MAC;
- RS处理请求后,将包直接会给Client;
过程很简单,但中间的问题很多:
更改MAC地址来达到转发的时候,Director 和 RS们必须在同一物理交换机下啊?
是的,这也是这个模式的缺点,Director必须和RS在同一交换机下。
RS在收到包之后,发现目的IP不是自己的IP,不会去处理,怎么办?
为了解决这个问题,需要给RS上绑定VIP。
Linux主机的IP和MAC映射关系会通告给整个交换机网络下,这样的话就会出现混乱了,RS和Director都有同样的IP,该发给谁?
可以通过设置内核参数来决定将哪些网卡通报,哪些不通报。一般来说绑定在lo上是最省事的。
Linux包从某个网卡出去,此网卡必须有某个IP才能以此IP为源地址出去,VIP现在绑定到lo上,如何能回包?
为了解决这个问题,需要加主机路由,所有source为VIP的包全部从连通公网的网卡走。
3 IP Tunneling(VS/TUN)

Director收到Client的请求包后,在外层再加上一个IP头为DIP|RIP后封装成IP隧道协议报文,然后发送给real server.
RS一定要可以识别IP隧道协议才可以,拆包后看到还有一个头是CIP|VIP,所以RS就打上VIP|CIP的IP头直接回给Client.
选择服务器
选择服务器本质上就是如何调度请求。LVS提供了下面的几个算法:
1 轮询(Round Robin)
算法将外部请求按顺序轮流分配到集群中的真实服务器上,它均等地对待每一台服务器,而不管服务器上实际的连接数和系统负载。
2 加权轮询(Weighted Round Robin)
根据真实服务器的不同处理能力来调度访问请求。这样可以保证处理能力强的服务器处理更多的访问流量。调度器可以自动问询真实服务器的负载情况,并动态地调整其权值。
3 最少链接(Least Connections)
算法动态地将网络请求调度到已建立的链接数最少的服务器上。如果集群系统的真实服务器具有相近的系统性能,采用"最小连接"调度算法可以较好地均衡负载。
4 加权最少链接(Weighted Least Connections)
在集群系统中的服务器性能差异较大的情况下,调度器采用加权最少链接调度算法优化负载均衡性能,具有较高权值的服务器将承受较大比例的活动连接负载。调度器可以自动问询真实服务器的负载情况,并动态地调整其权值。
5 基于局部性的最少链接(Locality-Based Least Connections)
针对目标IP地址的负载均衡,目前主要用于Cache集群系统。该算法根据请求的目标IP地址找出该目标IP地址最近使用的服务器,若该服务器 是可用的且没有超载,将请求发送到该服务器;若服务器不存在,或者该服务器超载且有服务器处于一半的工作负载,则用"最少链接"的原则选出一个可用的服务 器,将请求发送到该服务器。
6 带复制的基于局部性最少链接(Locality-Based Least Connections with Replication)
针对目标IP地址的负载均衡,目前主要用于Cache集群系统。它与LBLC算法的不同之处是它要维护从一个 目标IP地址到一组服务器的映射,而LBLC算法维护从一个目标IP地址到一台服务器的映射。该算法根据请求的目标IP地址找出该目标IP地址对应的服务 器组,按"最小连接"原则从服务器组中选出一台服务器,若服务器没有超载,将请求发送到该服务器,若服务器超载;则按"最小连接"原则从这个集群中选出一 台服务器,将该服务器加入到服务器组中,将请求发送到该服务器。同时,当该服务器组有一段时间没有被修改,将最忙的服务器从服务器组中删除,以降低复制的 程度。
7 目标地址散列(Destination Hashing)
根据请求的目标IP地址,作为散列键(Hash Key)从静态分配的散列表找出对应的服务器,若该服务器是可用的且未超载,将请求发送到该服务器,否则返回空。
8 源地址散列(Source Hashing)
根据请求的源IP地址,作为散列键(Hash Key)从静态分配的散列表找出对应的服务器,若该服务器是可用的且未超载,将请求发送到该服务器,否则返回空。
关于为什么要分篇来写
为什么要分开几篇写不是一篇写完呢?是因为我觉得,博客不是论文,不需要长篇大论一次把事情讲完。利用碎片时间就能读完才是好的。
不占用读者太长时间又能有收获才是我的追求。哈哈哈
作者和出处(reposkeeper) 授权分享 By CC BY-SA 4.0
关注微信公众号,获取新文章的推送!
LVS那些事的更多相关文章
- lvs的dr模式分析(二)
#vim /etc/init.d/lvsdrrip #!/bin/bash #DR server VIP=192.168.46.200 case "$1" in start) ...
- Linux LVS Nginx HAProxy 优缺点
说明:以下内容参考了抚琴煮酒的<构建高可用Linux服务器>第六章内容. 搭建负载均衡高可用环境相对简单,主要是要理解其中原理.此文描述了三种负载均衡器的优缺点,以便在实际的生产应用中,按 ...
- ysql+heartbeat+DRBD+LVS实现mysql高可用
在企业应用中,mysql+heartbeat+DRBD+LVS是一套成熟的集群解决方案,通过heart+DRBD实现mysql的主 节点写操作的高可用性,而通过mysql+LVS实现数据库的主从复制和 ...
- LVS Nginx HAProxy 优缺点
搭建负载均衡高可用环境相对简单,主要是要理解其中原理.此文描述了三种负载均衡器的优缺点,以便在实际的生产应用中,按需求取舍. 目前,在线上环境中应用较多的负载均衡器硬件有F5 BIG-IP,软件有LV ...
- 使用LVS+keepalived实现mysql负载均衡的实践和总结
前言 经过一段时间的积累,数据库的架构就需要根据项目不断的进行变化. 从单台数据库,到了两台数据库的主从,再到读写分离,再到双主,现在进一步需要更多的数据库服务器去支撑更加可怕的访问量. 那么经过那么 ...
- lvs与nginx区别
lvs和nginx都可以用作多机负载方案,他们各有优缺点,在生产环境中需要好好分析实际情况并加以利用. 一.lvs的优势: 1.抗负载能力强,因为lvs工作方式的逻辑是非常简单的,而且工作再网络层第4 ...
- LVS(五)LVS的持久连接
什么是持久链接 把某个客户端的请求始终定向到同一应用服务器上.对于LVS来说持久连接和算法没有关系.也就是使用任何算法LVS都可以实现同一客户端的请求转发到之前选定的应用服务器,以保持会话.而且还能实 ...
- keepalived + lvs
Keepalived原理 Keepalived原理 keepalived也是模块化设计,不同模块复杂不同的功能,下面是keepalived的组件 core check vrrp libipfwc li ...
- LVS专题-(3) 虚拟ip理解
1.虚拟IP是什么? 要是单讲解虚拟 IP,理解起来很困难,所以干脆把 动态 IP .固定 IP .实体 IP 与虚拟 IP都讲解一下,加深理解和知识扩展 实体 IP:在网络的世界里,为了要辨识每一部 ...
随机推荐
- QT的组件布局
在QT的IDE下,编写一个自定义布局. #include<QApplication> #include<QWidget> #include<QSpinBox> #i ...
- C++ 源代码到可执行代码的详细过程
编译,编译程序读取源程序(字符流),对之进行词法和语法的分析,将高级语言指令转换为功能等效的汇编代码,再由汇编程序转换为机器语言,并且按照操作系统对可执行文件格式的要求链接生成可执行程序. 源代码-- ...
- [原]SDL开发教程
SDL开发库:http://www.libsdl.org/ SDL中文开发教程:http://tjumyk.github.io/sdl-tutorial-cn/index.html SDL英文版开发教 ...
- 显示锁(ReentranLock)
1. Lock接口:定义了一组抽象的加锁操作,提供了一种无条件的.可轮询的.定时的以及可中断的锁获取操作,所有的加锁和解锁的方法都是显示的. 2. ReentrantLock锁:实现了Lock接口,并 ...
- Mysql分表和分区的区别、分库分表介绍与区别(转)
分表和分区的区别: 一,什么是mysql分表,分区 什么是分表,从表面意思上看呢,就是把一张表分成N多个小表,具体请看:mysql分表的3种方法 什么是分区,分区呢就是把一张表的数据分成N多个区块,这 ...
- FBKVOController代码阅读
功能:对kvo机制进行封装,简化使用,简化内存管理: 要素:观察者.被观察者.处理函数. 模式:注册表模式: 机制:对象创建.注册管理.内存管理.处理机制转换: 其它:注册去重: kvo的管理机制:
- 【BZOJ3757】苹果树(树上莫队)
点此看题面 大致题意: 每次问你树上两点之间路径中有多少种颜色,每次询问可能会将一种颜色\(a\)看成\(b\). 树上莫队 这题是一道树上莫队板子题. 毕竟求区间中有多少种不同的数是莫队算法的经典应 ...
- async--ajax异步传输
如图:轨迹点组编号依赖所属路口的设置. 所以ajax是异步执行,获取到所属路口还没执行完,就已经执行到根据所述路口获取轨迹点组编号,所以获取不到轨迹点组编号. async:false改成同步执行.就没 ...
- MFC中用户自定义类响应自定义消息
这篇技术文章不是讨论经典的MFC中的消息工作机理的,讨论消息工作原理.方式和路径的文章在网上和书本中随处可见.网上众多的讨论都是关于如何响应并进行用户自定义消息映射的:网上还有一些文章介绍如何在自定义 ...
- qsort()与sort的用法(收藏)
sort()函数是C++中的排序函数其头文件为:#include<algorithm>头文件: qsort()是C中的排序函数,其头文件为:#include<stdlib.h> ...