NOTAM宕机之后
上面的图是1月12日恢复中的美国国内航班,下面的图则是一周前的1月4号同时段航班,可见美国航班还没有完全从NOTAM的宕机中康复过来。这次NOTAM的崩盘让FAA一下子又站在了舆论的风口浪尖——如此重要的一套系统,为啥没有冗余能力?设计者们确实没有犯下低级错误,在架构时考虑了冗余能力,安排了备份系统,只不过没有及时完成替补的使命罢了。无论如何,NOTAM发布系统不能工作,让飞行行业很受伤。
NOTAM到底是个什么东西?它是飞行任务通知系统(Notice To Air Mission System)的缩写,是一套为飞行人员提供有关安全的重要信息的网络数据系统。NOTAM提供的信息之所以重要,主要在于它提供的信息并不是常规信息,而是关系到飞行安全的一些非常规信息。这些信息主要分为三类,第一是天气的实时变化信息,比如可能影响飞行安全的火山活动、强降雨和强降温等,第二类为飞行设施和服务的变更信息,比如机场因为施工或硬件故障而对设施和服务做出的调整;第三类为空域类信息,比如某些空域由于军事活动或者航天发射需要被临时占用,民用航班需要规避。这些信息一般都是在民用航班准备出航前最后需要取得的重要数据,一旦NOTAM系统崩溃,无法提供数据,民用航班就不能具备出航的条件。NOTAM最早使用的是电话通报方式,后来几经升级,改为网络数据系统,新系统在设计上有冗余考虑,但此次崩溃备份系统由于存在损坏文件无法及时补位,造成美国联邦航空管理局被迫启动古老的电话热线通知系统,但其效率无法满足大量航班的需求,无法实现替补功能。
受伤的民航业对FAA很有意见,不管NOTAM除了什么原因宕机(如果是断电宕机其实更尴尬),总之FAA每年从联邦政府拿到那么多预算,就有责任确保这套系统的稳定性,解释原因不重要,拿出改进方案更关键。美国政府特地通过新闻媒体向公众表示,NOTAM宕机过程中美国军用飞机的飞行没有受到任何影响,因为军队使用的NOTAM是分离于商业航空的独立系统,这就是让老百姓明白,美国的国防是没问题的,可以放心。然而,让人不放心的是,NOTAM系统这次宕机如果最终被证明在断电、病毒或软硬件以及架构设计上存在缺陷,那么是不是会让某些别有用心的网络攻击者信心大增?还记得《勇敢的心》里Longshank那句台词么:And not my gentle son. The mere sight of him would only encourage an enemy to take over the whole country——但愿这次宕机不会成为蓄意破坏者的encouragement。NOTAM这次宕机并不只是FAA的教训,更是对全球商业民航运营安全的一个警醒,民航运营管理的网络系统必须做到稳定有加,替补及时,备份有序,才能适应网络安全形势并不乐观的当下时局。