利用 DPU 驱动的交换机获取丰富的数据中心遥测数据

网络遥测是网络工程师和安全运营团队的珍贵信息来源。遥测采用多种形式,包括SNMP、设备内存和CPU利用率、端口状态、防火墙系统日志以及流量记录。特别值得一提的是流量记录,它们能够追踪通信的起始和目标地点,识别应用程序,并监测设备、协议和应用程序的带宽利用。

然而,在数据中心环境下,遥测数据的收集并非易事。通常,数据中心采用安装在网络设备上的硬件探测器或在服务器上安装的软件来进行数据采集。然而,这些探测器和代理的部署往往昂贵且复杂,且仅提供有限的可视性,通常只能获取数据中心流量的一小部分信息。要获得完整准确的数据,几乎需要搭建一个独立的网络,这无疑是得不偿失的。此外,对设备或软件代理的监控和维护工作增加了网络工程师繁忙的工作负担。

鉴于这些限制,许多公司不得不依靠从数据中心交换机收集的抽样遥测数据。然而,这种方法意味着典型解决方案只能基于网络总流量的少量样本提供洞察力,有时每8000个流量中只有一个样本,仅占所有流量的0.0125%。

我认为这种有限的采样是不可接受的,它限制了我们对数据中心的全面了解。此外,它还会影响AIOps工具的有效性,因为它无法完全洞悉网络中发生的情况。仅仅依赖采样流量可能会导致”垃圾进垃圾出”的情况,极大地限制了现代人工智能和机器学习工具所能提供的洞察力。

遥测技术拥有丰富多样的价值,可以展示网络状态和各设备的健康状况。它提供深入的性能洞察,对故障排除至关重要。通过正确的遥测数据,网络工程师可以在网络没有故障时提高平均解决时间(MTTR)或平均无故障时间(MTTI)。

遥测技术在安全操作中也具有重要价值。通过跟踪流量在网络结构中的东西向移动,安全团队可以识别异常情况或模式,从而发现显示可疑行为,不论是入侵者探查资源还是内部人员试图访问敏感系统。

此外,遥测对于包括AIOps在内的网络自动化至关重要。人工智能和机器学习工具依赖于遥测数据的分析,以生成基于上下文的洞察或采取自动化行动。没有遥测数据,现代AIOps将无法实现。将非采样数据流输入人工智能/机器学习工具为数据中心提供了几十年来一直需要的高级自动化条件。

DPU 为您的交换机装上眼球

那么,如何从数据中心获取更好的遥测数据呢?一种新的选择是将数据处理器(DPU)的计算能力与数据中心交换机结合使用。DPU是SmartNIC的升级版,是一种可编程处理器,旨在卸载和加速网络、安全和其他数据中心基础设施服务。DPU可以部署在服务器和交换机中。通过在ToR交换机中添加DPU,网络工程师可以通过直接位于数据中心流量路径上的计算机平台,在托管在数据中心的服务器上收集和输出流量、日志等遥测数据。

HPE Aruba Networking与AMD合作开发了业界首款支持DPU的交换机,即HPE Aruba Networking CX 10000 with AMD Pensando™ 交换机。CX 10000是一款1U设备,具备3.6 Tbps的标准线路速率无状态交换功能,并支持1、10和25 GbE端口选项,可与具备40/100 GbE上行链路的服务器连接。

据HPE称,CX 10000分布式服务交换机可在每个服务器机架上提供高达800 Gbps的有状态服务吞吐量。凭借集成的可编程DPU,它能够提供高度可扩展的东西向网络防火墙安全、完全非采样遥测、IPsec加密/解密和网络地址转换服务。CX 10000的外形设计旨在将这些服务分布到数据中心结构的边缘,并直接连接到每台服务器。通过这种方式,服务资源能够随着数据中心工作负载的增加而自动扩展。许多全球最大的超大规模企业都采用了相同的架构。

CX 10000还具备导出防火墙日志和行业标准的非采样IPFIX流量记录的能力。网络工程师可以根据自身需求设置流量采样的时间间隔,可以选择每秒一次、1分钟或更长的时间间隔,例如5分钟。

在数据流中

长久以来,企业一直在网络中部署遥测解决方案。如今,随着DPU嵌入交换机中,遥测功能已经融入网络架构中。由于这些功能由DPU承担,因此不会对交换机性能造成任何影响。

透过监控流量记录和日志,网络工程师可以快速地探测到拥塞、重传、丢包以及占用带宽的应用程序。这有助于加速故障排除过程,甚至使网络工程师能够在问题影响应用性能或服务水平之前进行预防。与众不同的是,由于现在能够对网络中的所有流量进行遥测,网络的可视性直接映射到每一个应用程序,而不再是传统的仅检查中继使用情况的方式。

然而,仅仅收集遥测数据还不够,对数据进行分析同样至关重要。最佳方式是利用流量分析仪、日志收集器和SIEM等专用系统来进行分析处理。HPE Aruba Networking开发了一套API,旨在将流量记录和日志提供给各种广泛应用于网络运营中心(NOC)和安全运营中心(SOC)的第三方工具。这些集成包括Splunk、Elastic、Guardicore和Augtera Networks等解决方案。

随着越来越多的基于人工智能和机器学习的系统进入市场,由DPU支持的CX 10000交换机将时刻为这些工具提供高保真的遥测数据,以便这些系统提供准确的、基于上下文的见解或自动化行动。

请登录评论。