在著名的“阿尔法狗斗”模拟近距离空战中,AI(人工智能)五次连胜F-16飞行员,引起了世人的关注,本文将重点介绍此次决战的相关细节,并讨论AI在军事中运用的可能性、局限性与发展。
在美国国防高级研究计划局的“阿尔法狗斗”虚拟空战中,AI(人工智能)击败了现役F-16飞行员。这一结果令全世界震惊。当然,实际上决战的条件设置中存在着对AI有利的内容,而且整个流程并非完全遵循实战。那么,AI究竟能在战场上做什么呢?本文将基于军事领域中AI的运用情况,探寻其可能性。
AI将取代人类?
近年来,民间产业界经常能够听到有关于AI的运用和研究的话题。我们几乎每天都能看到关于“AI能做XX事”的新闻报道,亦能看到“人类工作将被AI取代”的煽动性文章。就连在军事领域,也存在着数不清的武器、系统或实证试验,赞誉着AI的活用。
在这当中,当属DARPA举办的“阿尔法狗斗挑战试验”最为吸睛,这是个引起话题的重要案例。这项活动于2020年8月举行,通称为“阿尔法狗斗”,该活动本预计在4月进行,但由于新冠疫情的影响被迫推迟,最终于8月举办。
“阿尔法狗斗”的内容,是由学习了战斗机之间近距离格斗的AI与现役F-16飞行员进行“对战”。话虽如此,但若真的用实机进行试验的话风险过高。因此,F-16飞行员操作模拟器与电脑中的AI进行了对战。此种形式的对战结果,是AI一方的“五战全胜”。
以前也有以“AI战胜人类”为话题的事例。那就是谷歌用深层学习技术开发而成的人工智能围棋程序“阿尔法狗(Alpha
Go)”与韩国的职业棋手的对战,人工智能最终获胜。当AI在一个大家都觉得“人总比电脑强”的领域中出人意料地获胜,那些对新鲜话题十分饥渴的记者们自然会飞奔而来。同理,在“阿尔法狗斗”的消息引爆媒体时,也一定有人会说,“现在载人战斗机已日薄西山,从此是AI称霸的无人机时代了”。
然而,只要稍稍调查过“阿尔法狗斗”的幕后情况,或是学习过AI本身,即便不是朝日新闻这样专业的媒体,也会提出“稍等,这里有问题”的质疑。
能让AI做什么:传感器数据解析
接下来,本文将详细聊聊在军事领域中AI技术的活用。利用AI的核心在于“准备大规模的数据,让AI进行深度学习,就可以构建能完成高精度推理的AI”。换句话说,“要使AI能进行高精度推理,其基础在于让其学习大量数据”。
最为引人瞩目的,是AI对传感器信息的解析。首先让我们来回顾一下,人类是如何处理接收到的传感器信息的。
请想象一下,由无人机搭载的红外传感器捕捉到地面上有一些人的场景。如果是我们看到这一画面,可以判断“哦,这里有人”,这是基于我们过去学习经验的推理能力在发挥作用。也就是说,正是因为我们事先知道“人类是这样的”、“人类会这样行动”、“人类的体温会比周围的背景温度高,因此在红外线下会呈现出与背景不同的样子”,才能在看到红外传感器图像之时区分建筑物、植被与人类。这就是“基于学习的推理”。
就算对象不是人类,而是飞机、建筑物或者舰艇等,其基本逻辑也是一样的。用什么东西可以传感出什么图像、获得什么数据,我们通过多次实验积累数据,学会了如何从图像推导目标对象。如果没有基于经验的学习,那我们面对的只是电脑上的一些字符串而已。
“目标对象是什么”当然是重要的信息,“目标对象在做什么动作”也是非常重要的信息情报。举例而言,红外传感器拍摄影像拍到了若干个人,根据他们的站立位置与动作,可以推测“他们到底在做什么”。同样拍到5个人(“5”这个数字是随机选择,没有什么深刻含义),根据他们的不同位置关系能推导出的目标行为是完全不同的。
若在5人当中,4人停下脚步围着其中一人,这代表了什么呢?这种情况中,独立的那一人很有可能是指挥官或者领导,正在给其他4人下命令。此外,这也可能是4个下属正分别向领导进行汇报。
那如果同样是5人中有一人稍稍离队,另外4人排成一列的情况,又该如何解析呢?他们之间的关系也许相似,但具体状况就不一样了。无论领导是在下命令还是训诫下属,这样的列队方式,往往会出现在后方,而非最前线,往往体现了日常训练、而非战时行动。
此外,如果5人中出现了其中4人围着一人移动的情况,又该如何解读呢?被围着的那位,有可能是“要保护的指挥官或领导”,亦可能是“被捕俘虏或人质”。
类似的例子难以穷尽,此处点到为止。以上展示的也是运用“学习和推理”机能的其中一个例子。我们人类通过大量的经验与观察,积累了很多数据,能够把握“在这样的情况下,人会如何排列,如何运动”。这就是上文提到的推理能力在发挥作用。那若让AI进行这样的学习,是否可以进行同样的推理呢?
能让AI做什么:决策
无论在陆战、海战还是空战,在进行战术教育时,都会列举过去发生过的种种实战案例进行参考。在陆战中常说的“要想掌握战术,就必须处理超出想象的各种情况,战术就是实战经验的积累”,意指的就是通过学习过去事例,从而引导出属于自己的战术的这一过程。
要进行战术性决策时,需要决定的具体方面包括敌我各自可能行动的预测、当下环境状况的勘探、麾下战力的行动方式、兵力的运用方法等等。若敌军按军事教材般袭来,我方亦只需按教材那样进行防守即可。但实战若并未按教材般展开的话,我们就要通过所谓的“攻其不备”来掌握主导权了。但是,若连教材所教的、所禁止的行动都不懂的话,是无法“攻其不备”的。
因此,在这个领域也同样需要学习与基于学习的推理。
狗斗中的AI
在此,首先谈一下文初提到的“阿尔法狗斗”。在DARPA于2019年10月举办的“阿尔法狗斗挑战试验”中,有8支队伍参赛,他们分别是:
·极光飞行科学公司(AURORA Flight Sciences)
·EpiSCI
·佐治亚理工大学研究所(Georgia Tech Research Institute)
·苍鹭系统公司(Heron Systems)
·洛克希德·马丁公司(Lockheed Martin Corp。)
·透视实验室(Perspecta Labs)
·physics AI
·硕电(SoarTech)
2019年11月,比赛在约翰霍普金斯大学的应用物理研究所(JHU/APL)举行了第一次试验,并于2020年2月举办了第二次,2020年3月在内利斯空军基地举办了第三次试验。
在最终阶段,各队的AI与JHU/APL开发的“敌方AI”进行对战,最后获胜的苍鹭系统公司AI获得了在“阿尔法狗斗”中对战F-16精英飞行员的资格。
然而,如前文所述,AI离不开“学习和推理”。纯粹的基础AI仅仅处于一个“什么都不懂”的状态。因此,给予AI各种任务,让它进行学习的过程至关重要。
若以各种传感器将传来信息为前提,AI首要的学习任务就是情况识别,在此基础上,应采取怎样的行动则是飞行员的工作。普通情况是指从后方攻击敌机,但近年来,亦有可以离轴(off-boresight)交战的红外制导导弹,这另从后方攻击成了非必要选项。这样可以增加战术灵活性,但也会让判断复杂化。
由此,AI可以结合已把握的状况,预想敌机会如何活动,判断我方应如何反应,是否到了使用武器的时刻等等。如此,AI就可以积累经验,学习选项和判断导向下的优先顺序(加权)决策。
而苍鹭系统公司具体做了什么呢?事实上,该公司的AI已经具备了与拥有12年战斗机飞行经验的飞行员相当的经验,共执行了约40亿次任务。通过这些任务,该AI学习了“什么能做”“什么不能做”“考虑行动的轻重缓急”等相关内容。换句话说,要成为在狗斗中获胜的AI,必须学习大量有关空中格斗的数据,没有这些数据,AI就不可能获胜。
此外,2020年8月的“阿尔法狗斗”中,限定双方进行“一对一”决战,所以此次AI五战全胜是在单挑的情况下实现的,我们并不知晓在“多对多”情况下,AI的表现会如何,这是需要注意的。当前,作为AI空中格斗改进版的“二对一”决战试验已经在探讨中,其中蓝军(己方)2架,红军(敌方)1架。由“一对一”向“二对一”迈进,这种发展趋势让人们戏称:“AI马上就要让战斗机飞行员失业了”。
值得一提的是,在“阿尔法狗斗”中AI能够获胜,有以下几点需要厘清。
首先,“阿尔法狗斗”并不是在完全实战的背景下实施的,AI已经在决战之前获得了作战所需的全部必要数据,在情况认知方面已经处于优势。
其次,一般载人飞机之间的格斗都要保持在150米以上,而此次决斗没有这个限制,允许在极限近距离的情况下进行交战。飞行员出于本能考虑到自身安全因素会尽量避免极限距离的空中接触和冲突,而AI则根本不会考虑这一点。所以对人类飞行员来说,AI在极限范围内发起突击是根本无法预料的。
AI试验的目的
很多人认为,空中作战中AI越来越厉害,战斗机飞行员马上就要失业了。但事实上“阿尔法狗斗”的目的并非如此。决战的真正目的是证实AI能够做到这个程度,取得AI事业相关人员的信任。
一旦证实AI能够执行空中任务,那么伴随载人战斗机的智能无人“忠诚僚机”也能够得到活用。对载人战斗机来说过于危险的任务也能交给AI战斗机执行。事实上,不只是空中格斗,在其他技术领域也一样需要各种技术试验来获得整个行业的信任。
在空中格斗领域,AI的优势在于战术动作决策方面。事实上,由DARPA牵头的这项决战,还是在空中格斗的试验阶段,距离实用还非常遥远,这也是为什么要由DARPA来组织这项活动的原因。相比较而言,依托AI进行传感器信息处理则更为实用。那么具体AI是怎么进行传感器信息处理的呢?
AI进行传感器信息分析的实例
在导弹制导领域,依托AI对传感器数据进行处理分析是最为常见的。比较著名的就是洛马公司研制的机载反舰导弹AGM-158C LRASM中最为关键的制导部件,该部件由BAE系统公司提供。
大部分反舰导弹会通过主动雷达制导来引导飞行的最终阶段。原理是依托位于导弹前端的雷达对目标进行捕捉,然后通过空中动作的调整接近并打击目标。这些先进的导弹可以不分昼夜地进行全天候攻击,但防御方可能使用电磁干扰装置对导弹的雷达波进行搜索,进而通过电磁干扰阻止导弹命中目标。在这种情况下,像RIM-116
RAM这样的舰载反辐射导弹就会以电磁干扰装置的辐射源为目标进行精准打击。
在这些导弹中,LRASM反舰导弹就是比较特殊的一型,该导弹撤除了主动制导部件,在飞行中一旦发现敌舰发出的红外或者是电磁波信号,就会对信号源进行锁定并接近,因为该导弹使用的是被动制导技术,所以无法被敌舰的雷达波感知搜索到。因此,如果敌舰为了防止被该导弹击中而停止雷达的使用,其防空能力就会大大减弱。此外,海上舰船作为红外放射源是不可能停止向外散发红外信号的。
但从导弹本身来看,被动制导方式存在只能感知到目标的位置而无法感知到环境变化的问题。并且,水面舰艇在大部分场合都是有多艘舰组成阵型集体行动的,电磁波和红外线的信号源非常多,如何选择打击目标也是个问题,必须打击指挥中枢舰、航母、两栖登陆舰等高价值目标,打击低价值的小目标是没有意义的。有人提出,选择攻击电磁波和红外线强度较强的信号源不就行了?但在这种选择下,导弹很有可能会打到敌方专门设置的诱饵目标上。
考虑以上种种因素,当雷达探知到多个红外和电磁信号源时,必须筛选出值得攻击的高价值目标。笔者判断,LRASM导弹可能利用AI技术实现了这种筛选。
水面舰艇作战群在行动时,一般有“纵队阵”“横队阵”“圆形阵”等各种阵型,每种阵型中高价值目标的位置一般都是固定的。因此,当导弹制导系统探知到以阵型行动的水面舰艇,也许就能够通过感知电磁波和红外信号源的组成形状来推测高价值目标的位置。在不断学习各种阵型数据之后,即便是被动制导的导弹,也能够筛选出高价值目标进行打击。
当然,要实现这种功能,最好能够提前知道敌方雷达和通信器材的电磁波特征信息,以帮助辨识目标。
不过这里要多说一句,以上只是笔者的推测而已,到底LRASM导弹能不能活用AI系统,洛马和BAE系统公司都没有公开任何详细的信息。
基于影像的自动目标识别
以色列拉斐尔先进防御系统公司的公开信息显示,该公司研制的制导炸弹SPICE250的目标识别系统运用了AI技术。该型制导炸弹搭载电子光学传感器,能够依托可见光影像或者红外影像锁定目标。在这个过程中,该炸弹依托AI技术实现了自动目标识别(ATR)。
就像上文说的一样,光学传感器也好,红外传感器也好,都具备将收集到的信息数据化的功能,这些数据以字节的形式进入AI程序展开识别作业。“这可能是卡车”“这可能是坦克”“这可能是掩体”…… AI能够提出推测结论,帮助决策者选择目标。