失效转移
集群失效转移
集群失效转移是 AOS 10 中的一项新功能,允许为混合或隧道配置文件提供服务的 AP 在主数据中心的所有集群节点失效或变得无法访问时,在数据中心之间进行失效转移。通过在定义新的混合或隧道配置文件时选择次级网关集群,即可启用集群失效转移。与对客户端和应用程序无影响的集群内失效转移不同,集群之间的失效转移不是无缝的。
当在配置文件中选择次级集群时,为该配置文件提供服务的 AP 在正常操作期间会将客户端流量隧道传输到主集群。IPsec 和 GRE 隧道从 AP 建立到主集群和次级集群中的集群节点。当所有到主集群中集群节点的隧道都中断且至少有一个次级集群中的集群节点可达时,即会启动到次级集群的失效转移。下图展示了 WLAN 配置文件中主集群和次级集群的选择。
配置主集群和次级集群。
主集群故障检测通常在 60 秒内完成。当检测到主集群故障时,配置文件会被禁用 60 秒,以便将隧道客户端重新连接,允许在数据中心之间切换时进行广播域的变更。重新启用后,隧道客户端会获取新的 IP 地址,并能够通过次级集群恢复通信。AP 和客户端会话会以与主集群相同的方式在次级集群节点之间分配。每个 AP 根据每个节点的容量和负载被分配一个 DDG 和 S-DDG 会话,而每个客户端则根据桶映射分配一个 UDG 和 S-UDG 会话。
集群之间的失效转移可以启用或不启用抢占功能。当启用抢占时,当主集群中的一个或多个节点变得可用时,AP 会自动回切到主集群。启用抢占后,AP 会包含一个默认的 5 分钟保持定时器,以防止频繁切换。主集群必须正常运行 5 分钟(不可配置)后,才能进行回切。与从主集群到次级集群的失效转移类似,配置文件会被禁用 60 秒,以适应广播域的变更。
在考虑部署集群失效转移时,需要进行周密的规划,以确保次级集群中的网关具有足够的客户端和设备容量以应对失效转移。次级集群的容量应等于或大于主集群的容量。
除了容量规划外,还必须考虑 VLAN 分配。虽然每个数据中心内的 IP 网络可以是唯一的,但任何静态或动态分配的 VLAN 必须在两个数据中心中都存在,并在两个集群中进行配置。这将确保在失效转移期间,隧道客户端被分配相同的静态或动态 VLAN。如果实现了 VLAN 池,哈希算法将确保隧道客户端在每个集群中被分配到相同的 VLAN。
集群失效转移可以通过不同方式实现和利用。您的配置文件都可以设置为优先使用主数据中心的集群,只有在主数据中心发生故障时才切换到次级数据中心的集群。在正常操作期间,所有的流量工作负载都绑定到主数据中心。下图展示了主-次数据中心失效转移模型。
数据中心工作负载失效转移
或者,您的不同配置组中的 WLAN 配置文件可以设置为在数据中心之间分配主集群和次级集群。例如,园区中的一半 AP 可以配置为偏好主数据中心并在发生故障时切换到次级数据中心,而另一半 AP 则偏好次级数据中心并在发生故障时切换到主数据中心。采用此模型,流量工作负载将在两个数据中心之间均衡分配。这种方式有时被称为“盐撒式分布”,如下图所示。
数据中心工作负载分布
最后修改时间:2024 年 2 月 28 日(614bf13)