
由于网络规模、流量以及设备和应用程序的多样性的增加,现代网络基础架构极其复杂。手动配置这些网络变得过于耗时、容易出错和困难。为了提高效率,网络运营商至少需要脚本类型的自动化,或者更好的是,由AI(人工智能)驱动的智能自动化,该自动化意识到人类操作员在管理网络时会考虑的所有方面,并将其知识的总和应用于更大的规模和增加的复杂性。
在这篇博客文章中,我们将深入研究AI自我优化网络的基本组成部分,以及它们是如何协同工作的。
自我优化网络的目标是为用户提供稳定的连接,并满足用户的流量需求,使他们能够体验最高的服务质量。实际上,这种人类感知的用户体验很难自动衡量。为了构建、训练和评估 AI,我们使用可直接测量的替代指标,例如吞吐量、延迟或资源效率。对于每个用例,我们选择一个度量—网络运行情况以及与其他网络相比情况的数字表示。
我们确定了影响所选指标的因素,并将它们分成两种类型: 允许AI控制的因素 (可控因素),和假定为给定的 (环境因素)。
以优化Wi-Fi网络中的 AP无线电传输参数为例。可控因素包括射频信道带宽和射频发射功率水平。Wi-Fi 接入点硬件实际上可以在这些因素的各种设置下运行,我们选择让AI决定哪种设置是最佳的。
环境因素包括,例如,部署中相邻 AP 之间的间距,取决于覆盖区域中建筑材料的 RF 信号的传播特性,以及连接的客户端设备的 RF 特性。AI不能随意修改这些因素 (它们可能会随着时间的推移而自然变化)。
配备了可衡量和可控的目标函数及环境因素的定义后,我们对网络进行了检测,以持续收集这些数据,并将其报告给云。因此,对于每个网络和每个时刻,云AI都知道网络运行的状态、可控因素的当前设置以及环境因素的当前值。
为了公平地评估性能,我们将每个网络与其对等组(peer group)进行排名,对等组是具有相同环境因素的其他网络的集合。例如,一个网络可能排在其对等网络的10%,也就是说,它的表现比其他90%的对等网络差。由于对等网络之间的主要区别是可控因素的分配,因此AI 算法可以通过修改可控因素来将该网络在排名中向上移动。
可控因素的最佳设置在以下两种模式之一中确定:
通过监督学习,所有网络的过去数据被提炼成一个AI模型,该模型可以预测网络的目标函数值及其当前环境因素,以及任何可能的可控因素设置。使用这些预测,很容易在所有可能的设置中选择最佳设置。在这种模式下,AI 利用嵌入在可用数据中的知识来优化每个网络。
或者,通过主动学习,AI可以获得过去数据中没有的新知识。该算法有目的、谨慎地将可控因素设置为以前从未尝试过的值的组合。在这种模式下,AI 探索机会空间,以确定每个网络以前未知的优化潜力。
AI运营自驾网络(self-driving)的关键构件(key building blocks)是一个有意义的、可测量的目标函数,它的可控因素和环境影响因素,一个庞大而多样的数据集合,与之相对的对等组的定义,以及AI 模型和算法在每个操作条件下,自动最佳分配可控因素。
在未来后续的文章中,我们将重点关注这些构件,以详细了解挑战并展示 Aruba 产品中可用的解决方案。
关于作者
Bernd Bandemer Aruba数据科学(Data Science)总监
Bernd Bandemer是Aruba的数据科学总监,他的团队负责设计,实施和部署用于Aruba的云产品的AI / ML组件。
原文:https://blogs.arubanetworks.com/spectrum/cutting-through-the-ai-mist-2/