「WLAN」- 实现 AC 高可用

在 WLAN Networking 中,为保证组网可靠性,常见的备份技术有:
1)VRRP 双机热备份(主备)(VRRP + Hot Standby)
2)双链路冷备份(Dual-link Cold Backup)
3)双链路热备份(主备&负载分担)(Dual-Link Hot Standby)
4)N+1 备份(N+1 Backup)

概念术语

Hot-Standby Backup

HSB(Hot Standby Backup,热备份)是华为主备公共机制,涉及 HSB Service(主备服务)与 HSB Group(主备备份组)两个概念;

为了保证 WLAN 业务的稳定运行,热备份(Hot-Standby Backup)机制可以保证在主设备故障时业务能够不中断的顺利切换到备份设备。

HSB Service

建立和维护 HSB Channel ,为各个主备业务模块提供通道通断事件和报文发送/接收接口;

HSB Service,负责两个方面:
1)在两个互为备份的设备间建立主备备份通道:通过配置主备服务本端和对端的 IP-Address 和 Port-Number,从而建立主备机制报文发送的 TCP 通道,为其他业务提供报文的收发以及链路状态变化通知服务。
2)维护主备备份通道的链路状态:为其他业务提供报文的收发服务,并在备份链路发生故障时通知主备业务备份组进行相应的处理。通过发送主备服务报文和重传等机制来防止TCP较长时间中断但协议栈没有检测到该连接中断。如果在主备服务报文时间间隔与重传次数乘积的时间内还未收到对端发送的主备服务报文,设备则会收到异常通知,并且准备重建主备备份通道。

HSB Group

HSB Group 内部绑定 HSB Service,为各个主备业务模块提供数据备份通道。HSB Group 与单个 VRRP 实例绑定,借用 VRRP 机制协商出主备实例。同时,HSB Group 还负责通知各个业务模块处理批量备份、实时备份、主备切换等事件;

VRRP Hot Standby

原理简述

VRRP 双机热备份:
1)主备 AC 两个独立的 IP 地址,通过 VRRP 对外虚拟为同个 IP 地址,单个 AP 和 Virtual-IP 建立一条 CAPWAP 链路;
2)主 AC 备份 AP 信息、STA 信息、CAPWAP 链路信息,并通过 HSB 主备服务将信息同步给备 AC;
3)并且 HSB 主动追踪 VRRP 状态,当 Primary-AC 故障后,Backup-AC 直接接替工作;

1)两台 AC 组成一个 VRRP 组,Primary-AC、Backup-AC 对 AP 始终显示为同个 VIP 地址:两台 AC 通过 VRRP 协议产生一台 Virtual AC;
2)Primary-AC 通过 HSB 同步业务信息到 Backup-AC 上(在缺省情况下,Primary-AC 担任 Virtual-AC 的具体工作);
3)AP 只看到一个 AC 的存在,所有 AP 与 Virtual-AC 建立 CAPWAP 隧道;
3)AC 间的切换由 VRRP 决定。当 Primary-AC 故障时,Backup-AC 接替其工作;

HSB Channel,可通过两台 AC 之间的直连物理链路承载,也可通过交换机承载,例如复用VRRP报文交互所处的物理通道。

数据同步

问题:当主用设备出现故障,流量切换到备份设备时,要求主用设备和备份设备的会话表项完全一致,否则有可能导致会话中断。所以需要一种机制在主用设备上会话建立或表项变化时将相关信息同步保存到备份设备上。

方案:HSB Service 处理模块可以提供数据的备份功能,它负责在两个互为备份的设备间建立 HSB Channel ,并维护 HSB Channel 的链路状态,提供报文的收发服务。基于 VRRP Hot-Standby 方式,其备份包括:用户表项、CAPWAP 链路信息、AP 表项、DHCP地址信息备份;

备份的方式有:
1)批量备份:Primary 会将已有的会话表项一次性同步到新加入的 Backup 上,使各 AC 信息对齐,这个过程称为批量备份。批量备份会在 AC 主备确立时进行触发。
2)实时备份:当主用设备在产生新表项或表项变化后,会及时备份到备份设备上。
3)定时同步:备用设备会每隔 30min 检查其已有的会话表项与主用设备是否一致,若不一致则将主用设备上的会话表项同步到备用设备;

特性特征

这种方式一般将 Primary-AC、Backup-AC 部署在同一地理位置(鉴于 VRRP 要求二层互通)
和其他备份方式比较,其业务切换速度非常快。

补充说明

AC 目前支持 VRRP 单实例整机热备(HSB Group 仅能绑定一个 VRRP 实例),不支持负载均衡。整机热备具有以下特点:
1)上行链路可以互为备份,主备VRRP可以track上行口状态,AC整机主备状态可能与各下行链路通断状态不一致。
2)下行多条链路(包括有线、无线) 采用 MSTP 破环,MSTP 状态变更时会自动清除链路上的 MAC/ARP 表。

配置流程

基于 VRRP 的双机热备,热备相关的业务都注册到同个 HSB Group,HSB Group 内部绑定 HSB Service,同时 HSB Group 与单个 VRRP 实例绑定,从而业务通过 HSB Group 获知当前用户的主备状态、以及主备切换等事件,并通过 HSB Group 的接口进行备份数据的接收和发送。

1)配置 VRRP Group:创建VRRP备份组并配置虚拟IP地址。
2)配置 HSB Service:创建HSB主备服务,建立HSB主备备份通道的IP地址和端口号。
3)配置 HSB Group:创建HSB备份组,配置HSB备份组绑定HSB主备服务、VRRP备份组、WLAN业务以及DHCP。
4)使能 HSB Group:使能HSB备份组,HSB备份组使能后,对HSB备份组的相关配置才会生效。
5)检查配置结果:检查VRRP热备份配置结果。

Dual-Link Hot Standby

原理简述

业务信息直接绑定 HSB Service,这样 HSB 对业务信息仅提供备份数据收发的功能,用户 AP 的主备状态由双链路机制进行维护。

在双链路双机热备场景下:
1)单个 AP 分别与 Primary-AC、Backup-AC 建立 CAPWAP 链路:一条主链路;一条备链路;
2)Primary-AC 仅备份 STA 信息,并通过 HSB Service(HSB Channel)将业务信息同步给 Backup-AC;
3)当 Primary-AC 故障后,AP 和 Primary-AC 间链路被迫断开,AP 会通知 Backup-AC 切换成 Primary-AC,而后 AP 切换到备链路上,Backup-AC 接替工作;

为了避免业务配置重复下发导致错误,在 AP 和 Primary-AC 建立主隧道并且配置下发完成后,才启动备 CAPWAP 链路的建立。

建立主链路

当 AP 与 AC 建立主链路时,要在 Discovery 阶段要优选出 Primary-AC,除了之外,其他过程跟正常情况下的 CAPWAP 隧道建立过程一致。

当使能双链路备份功能后:
1)AP 开始发送 Discovery Request 报文,分为单播方式和广播方式:
—- 单播:如果预先通过静态方式、DHCP服务器方式 、DNS方式指定主备AC的IP地址,AP 向 AC 发送单播报文请求与主备 AC 关联;
—- 如果没有配置AC的静态IP地址或者单播没有回应时,AP将发送广播报文请求同网段内可关联的 AC;
2)AC 收到 Discovery Request 报文后回应 Discovery Response 报文;
—- 不管是单播发现还是广播发现,如果主备 AC 都正常,都会回应Discovery Response报文,并在该报文中携带双链路特性开关、优先级、负载情况以及IP地址。
3)AP 收集到 AC 回应的 Discovery Response 报文后,根据其中的:Prioity、设备的负载情况、AC IP-Address 来决定 Primary-AC;
—- 比较 AC 的优先级,优先级值小的为主AC,默认优先级为0,最大值为7;优先级取值越小,优先级越高。;
—- 比较 AC 的负载情况,即 AP 个数和 STA 个数,负载轻的为主AC。优先选择当前可接入AP数大的AC为主AC,如果当前可接入AP数相同,则选择当前可接入STA数大的AC为主AC;当前可接入AP数=可接入的最大AP数-当前已接入的AP数;当前可接入STA数=可接入的最大STA数-当前已接入的STA数。
—- 比较 IP-Address 大小,IP Address 小的为主AC。
4)AP 开始与优选出的 Primary-AC 建立 CAPWAP 主链路;

建立备链路

AP 与 AC 建立备链路:
1)Primary-AC 下发配置到 AP 上;
2)AP 开始建立备用隧道,向 Backup-AC 发送单播 CAPWAP Discovery Request 报文;
3)Backup-AC 收到 Request 报文后,回应 Response 报文,其中携带优选AC的IP地址、备选AC的IP地址、双链路特性开关、负载情况及其优先级。
4)AP 收到 Backup-AC 回应的 Response 报文后,获取到双链路特性开关为打开,并保存其优先级。

补充说明:
1)如果该 AC 的优先级修改为比已经建立好 CAPWAP 链路的 AC 优先级高,也不进行主备倒换,待建立隧道完成后再进行倒换。
2)AP发送的Join Request中,会携带一个自定义消息类型,告诉备AC配置已经下发过了,不需要再下发。AC收到Join Request,获取到该自定义消息时,在配置下发阶段,会跳过配置下发流程,避免对AP重复下发配置。
3)备链路建立完成后,AP重新根据两个链路的优先级决策出主备AC。
4)缺省情况下,CAPWAP心跳检测的间隔时间为25秒,心跳检测报文次数为6。如果开启了双链路备份功能,则CAPWAP心跳检测的间隔时间为25秒,心跳检测报文次数为3。如果配置 CAPWAP 心跳检测间隔时间和次数 < 默认值,则会影响CAPWAP链路可靠性,请谨慎修改,建议使用默认值。在配置双链路备份时,如果需要使用 WDS 或 Mesh,建议配置 CAPWAP 心跳检测的间隔时间为 25 秒,心跳检测报文次数至少为 6 次(否则由于双链路备份时缺省的心跳报文间隔时间为 25 秒,心跳检测报文次数为3次,会导致WDS或Mesh链路不稳定,无法保证用户正常接入);

特性特征

该方案除了支持主备备份之外,还支持负载分担模式。负载分担模式下可以指定一部分AP的主AC为AC1,与其建立CAPWAP主链路,一部分AP的主AC为AC2,与其建立CAPWAP主链路。

双链路双机热备的主备AC不受地理位置限制(AP/AC 三层互通,非隧道模式,AC 仅负责下发配置),部署灵活,可进行负载分担,有效利用资源,但业务切换速度较慢。

图中,AC1 和 AC2 经过部署为双链路双机热备,只绑定 HSB Service,提供双机热备份 HSB 隧道。AP 需依次与两台 AC 建立 CAPWAP 隧道,通过 AC 下发的 CAPWAP 报文中的 Priority 判断 Primary-AC 与 Backup-AC;

Dual-link Cold Backup

双链路冷备份
1)单个 AP 分别与 Primary-AC、Backup-AC 建立 CAPWAP 链路:一条主链路;一条备链路;
2)AC 不备份同步信息;
3)当 Primary-AC 故障后,AP 切换到备链路上,Backup-AC 接替工作;

这里不再赘述,仅是未开启 HSB 同步;

N+1 Backup

N+1 Backup,是指在 AC+FIT AP 的网络架构中,使用一台 AC 作为 Backup-AC,为多台 Primary-AC 提供备份服务的一种解决方案。

原理简述

1)单个 AP 只和某个 AC 建立 CAPWAP 链路;在网络正常情况下,AP 只与各自所属的 Primary-AC 建立 CAPWAP 链路。
2)AC 不备份同步信息;
3)当 Primary-AC 故障后(或 AC 与 AP 间 CAPWAP 链路故障),AP 重新与 Backup-AC 建立 CAPWAP 链路,Backup-AC 接替 Primary-AC 工作来继续管理 AP,Backup-AC 与 AP 间建立 CAPWAP 链路,为 AP 提供业务服务。

主备选择

在 Discovery 阶段,AP 发现 AC 后,要选择出最高优先级的 AC 作为主 AC 接入:在 AC 上,存在两种优先级:
1)全局优先级:针对所有AP配置的AC优先级,默认为0,最大值为7,优先级取值越小,优先级越高。
2)个性优先级:针对指定的单个AP或指定AP组中的AP配置的AC优先级,没有默认值。
全局优先级 < 个性优先级,即针对 AP 来优先使用个性优先级。

当 AC 收到 AP 发送的 Discovery Request 报文时:
1)如果 AC 没有为该 AP 配置个性优先级,则在回应的 Discovery Response 报文中携带全局优先级;
2)如果 AC 已为该 AP 配置了个性优先级,则在回应的 Discovery Response 报文中携带个性优先级。

正确配置 Primary-AC 和 Backup-AC 的不同优先级,可以控制 AP 能够在指定的 AC 中上线。

优选顺序如下:
1)AP 查看优选 AC(允许配置多个优选):如果只有一个优选 AC,则此 AC 作为 Primary-AC。如果存在多个优选 AC,则选择负载最轻的 AC 作为 Primary-AC。如果负载相同,则选择IP地址最小的作为 Primary-AC;
2)如果没有优选 AC,查看备选 AC(也允许配置多个备选):如果只有一个备选 AC,则此 AC 作为 Primary-AC。如果存在多个备选 AC,则选择负载最轻的 AC作为 Backup-AC。如果负载相同,则选择 IP 地址最小的作为 Primary-AC;
3)如果没有备选 AC,比较 AC 的优先级(除了优选、备选外,网络还有其他 AC 设备),优先级最高的作为主AC。优先级取值越小,优先级越高。优先级的具体判断方式参考主备优先级:
—- 在优先级相同情况下,则选择负载最轻的AC作为主AC;负载的比较方式:比较AC设备的负载情况,即AP个数和STA个数,负载轻的为主AC。优先选择当前可接入AP数大的AC为主AC,如果当前可接入AP数相同,则选择当前可接入STA数大的AC为主AC;
—- 在负载相同情况下,继续比较IP地址,IP地址小的为主AC。

特性特征

支持主备倒换,支持主备回切。

高可用对比(总结)

VRRP 双机热备
1)切换速度:主备切换速度快,对业务影响小;通过配置VRRP抢占时间,相比于其他备份方式实现更快的切换;
2)异地部署:不建议主备AC异地部署;
3)约束条件:主备AC的型号和软件版本需完全一致;一台备AC只支持为一台主AC提供备份;
4)适用范围:对可靠性要求高,且无须异地部署主备AC的场景

双链路双机热备
1)切换速度:AP状态切换慢,需等待检测到CAPWAP断链超时后才会切换;主备切换后终端不需要重新上线;
2)异地部署:支持主备AC异地部署;
3)约束条件:主备AC的型号和软件版本需完全一致;一台备AC只支持为一台主AC提供备份;
4)适用范围:对可靠性要求高,且要求异地部署主备AC的场景;

N+1 备份
1)切换速度:AP状态切换慢,需等待检测到CAPWAP断链超时后才会切换;AP、终端均需要重新上线,业务会出现短暂中断
2)异地部署:支持主备AC异地部署;
3)约束条件:主备AC产品形态可以不同,AC的软件版本必须一致;一台备AC支持为多台主AC提供备份,能降低购买设备的成本。
4)适用范围:对可靠性要求较低,对成本控制要求较高的场景;