学术咨询

让论文发表更省时、省事、省心

无人系统生存智能与安全、免疫、绿色控制技术

时间:2022年05月13日 分类:经济论文 次数:

摘 要:物竞天择,适者生存。动物经过亿万年进化,面对病毒侵袭、环境剧变、天敌侵害、种群竞争等挑战,具备了极端环境下的生存和繁衍能力。与动物一样,无人系统同样面临干扰、攻击、拒止、损伤、故障等不确定和异常因素的影响。在干扰对抗态势下,保证无人系统是会学

  摘 要:物竞天择,适者生存。动物经过亿万年进化,面对病毒侵袭、环境剧变、天敌侵害、种群竞争等挑战,具备了极端环境下的生存和繁衍能力。与动物一样,无人系统同样面临干扰、攻击、拒止、损伤、故障等不确定和异常因素的影响。在干扰对抗态势下,保证无人系统是“会学习”还是“能生存”,已成为一个挑战性问题。本文从控制论的角度提出无人系统的生存智能问题以及三个相关的关键控制要素:安全控制、免疫控制和绿色控制。其中,安全控制涉及无人系统对于多源干扰和故障的抗扰与容错控制;免疫控制涉及无人系统对于对抗与竞争态势的自主感知、自我调节以及学习进化问题;绿色控制涉及无人系统在多约束下的“节能”、“节时”、“省力”和“省心”等控制问题。目标是使无人系统从智能行为和功能的角度具备“赋生”(视系统如生命、器件似器官)能力,提升无人系统在危险、极端、特殊、恶劣环境下的生存能力。

  关键词:无人系统;生存智能;安全控制;免疫控制;绿色控制;干扰消纳

无人智能系统

  1 研究背景与现状

  物竞天择,适者生存。动物在亿万年的进化过程中,面对病毒侵袭、环境剧变、天敌侵害、种群竞争,形成了强大的环境适应、生存与进化能力,具有对于病毒的免疫性、对于恶劣环境的耐受性、对于天敌的预警能力和隐蔽性,从而保证了种群的繁衍生息[1]。自产生伊始,控制论就与动物和机器的信息处理和反馈机理密切联系[2]。文献[3-6]深入讨论了生物自生性、生命衰老与控制论中超稳定性、主被动缓冲调节以及干扰环境适应性等问题的联系。

  上世纪50年代,图灵提出了著名的图灵测试,促进了机器学习等人工智能技术的快速发展[7]。近年来,以谷歌旗下DeepMind公司研发的AlphaGo为标志,人工智能已逐渐能像人类一样开始学习,人工智能技术得到了前所未有的重视和发展。随着从自动控制、自主控制到智能控制理论和技术的发展,控制理论已经与人工智能紧密结合,在航空航天、装备制造、工业过程、交通运输等领域发挥了重要作用[8-22]。

  无人系统包括机器人、无人机、无人艇、无人潜器以及导弹、卫星等依靠自主导航和控制的运动体。智能无人系统是机器和动物智能行为的融合体现,已成为人工智能技术的重要载体[8-11][18-22]。现有人工智能的研究仍以机器学习的“脑智能”为主,在模拟人的感知、思维与学习过程的基础上,已使无人系统初步具备了“视觉”、“听觉”、“嗅觉”、“触觉”等智能行为。基于机器视觉的感知与理解、强化学习、语音识别等人工智能技术在无人系统环境感知、自主规划与决策、协同控制等方面发挥了重要作用,已成功应用于无人车自动驾驶、空地协同等多种任务场景中[18-22]。

  例如,Boston Dynamics公司研制的机器人可以完成跳跃、后空翻、越障等一系列类人动作,但是仍局限于已知的结构化环境。目前的智能无人系统技术集中在对于类脑、视觉、听觉等器官功能和结构化环境下行动能力的研究,缺乏对于干扰对抗和非结构化环境下智能行为的刻画和实现。卫星、导弹、无人机、野外机器人等类型的无人系统具有以下基本特点,同时对于控制系统和人工智能技术带来了新的挑战:

  1)长期在非结构化、陌生与复杂干扰环境中运行,干扰、对抗和不确定性因素复杂,难以事先学习和预测;2)在干扰和陌生环境下,对于目标、环境和运动信息的获取和感知能力不足,无法快速标定,难以实时维护、支援和修复;3)具有强构型约束特性,需要满足时间(跟踪、识别和机动速度等)、空间(飞行包络、轨道、安全走廊和障碍物等)、物理(构型局限、机构饱和、通道非匹配、欠驱动等)、能量(燃料受限等)、信息(量测不完备等)五大类系统约束。因此,随着任务、环境、对象的日益复杂化,对无人系统的精确性、可靠性和自主性需求不断提升,如何突破“预设任务、理想环境、确定模式”的藩篱,提升无人系统的智能自主能力已成为一个挑战性问题。与动物类似,在干扰、对抗、博弈等不确定态势下,无人系统同样面临着电磁干扰等“病毒侵袭”、高低温/强辐射等“环境剧变”、敌方打击/全域监视等“天敌侵害”、资源分配/载荷互干扰等“种群竞争”的影响。

  具体而言,无人系统性能会受到气象、温度、电磁等外部环境干扰,信息欺骗、信号拒止、通道阻塞等人为主动干扰,传感器测量噪声、控制机构误差、结构振动、机构摩擦与器部件退化等内部干扰,以及模型不确定性等因素的影响[23-26]。同时,干扰对抗易导致无人系统的信息污染、结构损伤、执行机构与传感器失效等故障,带来系统动力学特性、气动特性、输入效率与量测信息的不可预测变化[27-32]。干扰、拒止、攻击、封锁、损伤、故障等不确定因素的存在使无人系统的安全性始终受到严重威胁,“生存”能力已经超过“思维”能力成为无人系统最基本的需求。

  对于在“病毒侵袭”、“天敌威胁”、“种群竞争”等态势和极端环境下的无人系统,其行为的智慧性首先表现在高超的“抵御病毒”、“应对天敌”、“适应环境”的能力。对于无人系统而言,生存能力和学习能力同等重要。在干扰对抗环境下,无人系统是“学习”还是“生存”?这是一个问题。受动物进化和生存能力的启发,本文通过交叉融合控制科学、生命科学、人工智能等学科的前沿理论与技术,探讨如何提升干扰对抗环境下无人系统的“生存智能”,即从传统的“机器学习”进一步拓展到“机器生存”的意义;从控制理论的角度提出了干扰对抗环境下无人系统生存智能的几个要素:安全控制、免疫控制与绿色控制。简述了若干无人系统生存智能的基础问题、关键技术以及未来的解决思路。

  2 安全控制对于危险态势、特殊任务、恶劣条件等极端不确定环境下的无人系统而言,干扰和故障是影响其安全性能和寿命的主要不确定因素[23-28]。例如,台风、火灾、暴雨等环境下应急救援任务给无人机技术带来了极大的挑战,非结构化及陌生环境下机器人的精准作业技术仍然难以实现。日益复杂的结构和任务使得无人系统的风险日益增加,如强对抗、变构型、强机动等特殊任务会引起卫星、无人机等质心和惯量的大幅时变偏移,从而导致控制性能下降甚至失稳。

  从生命科学的角度,无人系统抗扰与容错控制过程对应于“看病、治病、养病”的过程。从控制理论的角度,上述扰动、误差、噪声、攻击、退化、失效以及若干参数变化等不确定性均可描述为系统干扰变量的影响。多来源、多类型、多通道的复合干扰与故障信号交联耦合,在闭环回路中相互影响,使得无人系统的干扰估计、故障检测与抗干扰容错控制成为一个理论难题[24-26]。

  干扰、故障等其他未知因素都可以表征为控制系统的不确定和随机变量。按抗干扰能力区分,传统的抗干扰和鲁棒控制可以分为干扰抑制和干扰补偿(抵消)方法两类:以最小方差控制、H∞控制、H2 控制等为代表的干扰抑制方法通过性能优化来降低干扰对系统期望性能的影响 ; PID 控 制 、 基 于 干 扰 观 测 器 的 控 制(DOBC)、自抗扰控制(ADRC)等干扰补偿方法可以实现对常值、谐波、变化率有界等干扰的实时补偿[25]。然而,这些方法主要存在三个问题,影响了相关理论方法的实际应用,无法保证无人系统在危险、极端、特殊和恶劣(“危极特恶”)环境下的性能:

  其一,局限于单一同质干扰系统,忽略了干扰和不确定性变量的多源性和动态特征,缺乏对于多源干扰之间、干扰与状态、输入和输出之间的动静态拓扑联系的刻画;其二,以干扰抑制为工具的抗扰、鲁棒和容错控制方法仅考虑内部可控、内部稳定性以及相对抑制能力,理论上无法完全保证系统对于外部干扰的绝对量化能力;其三,以干扰补偿和抵消为目标的方法依赖于干扰不变性设计准则,难以实现系统性能的自主调节和重构优化。围绕智能无人系统在多源干扰与故障环境下的高精度和高安全需求,无人系统安全控制技术需要解决如下关键问题:多源干扰与故障的表征/识别/估计与量化分析、复合精细抗干扰控制技术、故障自愈与重构控制技术等。与传统抗扰与容错控制理论相比,安全控制需要实现从单一同质变量到多源异质变量、从内部稳定到外部稳定、从干扰不变性设计到适应可变性设计的理论突破[24-27]。

  2.1 多源干扰的表征、估计与量化分析干扰、故障等多种不确定性广泛存在于无人系统中且相互耦合,给控制系统的设计与分析带来极大挑战。2015 年,美国 DARPA 启动了“量化物理系统的不确定性”(EQUiPS)项目,对建模与设计过程中多来源的不确定性进行有效表征、量化与管理。美国麻省理工学院、斯坦福大学、桑迪亚实验室等机构围绕高超声速飞行器、水翼船等复杂系统开展了不确定性量化分析研究。在控制科学领域,干扰和不确定变量的估计和辨识技术已成为一个研究热点。传统的干扰观测器和扩张状态观测器理论缺乏对于多源干扰信息的充分利用和深度刻画,对于具有异质异构特征的多源干扰缺乏可分离性研究,因此适应性小、保守性大。

  本团队于 2002 年起开展多源干扰表征、估计与量化分析研究,针对受干扰与故障影响的无人系统,建立包括多源异质异构变量的运动学、动力学以及生物学深耦合动态模型,揭示了多源干扰/故障信号与系统状态、输入、输出之间的深耦合动态关系,提出了具有加性、乘性、隐性形式的多源异质未知信号检测、识别、估计、预测方法以及相应的可分离性判据。多源复合信号的分离和识别需要充分利用未知信号的静、动态特征(包括动态性、随机性和能量有界特性),建立干扰与故障信号的异质异构精细建模与表征方法;从“传感-通信-控制-执行”的全信息流回路揭示多源异质信号的传递和影响机理,提出复合干扰与故障的信号分离与因果分析方法;提出基于微循环小回路的未知信号估计、预测与溯源方法,克服传统方法仅针对单一同质变量(干扰/故障)的局限性,为无人系统安全控制的系统设计和建模方法提供理论基础。上述内容也是不确定性量化和数字孪生理论的重要拓展。

  2.2 复合精细抗干扰控制技术

  无人系统本身存在时间、空间、物理、能量、信息等五大类约束。在博弈对抗、应急救援、察打一体、反恐防暴等无人系统复杂任务过程中,环境干扰、惯性未知、结构振动、通道耦合、器件退化等干扰和不确定因素的存在,使得无人系统的高精度、强自主控制技术成为一个理论和技术难题。传统的抗干扰控制方法大多局限于单一同质干扰。有的基本不依赖于干扰本身特征(如ADRC),保守性大;有的过于依赖干扰和系统模型(如内模控制),适应性小。现代控制理论的稳定性、可控性和可观性分析方法作为理论基石,仍局限在对内部状态特性的刻画,难以反映干扰等外部输入对于系统性能的影响。对于干扰对抗态势下的无人系统而言,需要开展对干扰和不确定性等“外部”特性的重新刻画和精细量化[24-26]。干扰稳定性(干扰影响下的稳定性)以及干扰可控性(干扰影响下的可控性)、可控度分析成为抗干扰控制理论的重要内容。

  另一方面,对于复杂环境下的无人系统而言,无论是单一的干扰抑制还是单一的干扰补偿方法都难以奏效。根据干扰特征和结构特性设计多源干扰同时抑制和补偿的复合控制方法,做到“知己知彼、对症下药”,将是实现具有强抗扰控制能力的有效手段。为此,首先需要在干扰表征与深耦合建模的基础上,研究多时空约束下无人系统外部可控能力与鲁棒因果溯源性能量化分析研究。突破无人系统抗干扰指定性能控制、多源干扰精细补偿和量化抑制方法、动基座变质心高精度机动控制、姿轨一体精细抗干扰协调控制和分配等关键技术,完成对无人系统“感知-导航-控制”一体化设计,实现从传统内部稳定性到外部稳定性、从状态可控到干扰可控的跨越。同时,精细抗干扰控制技术也可避免“过度医疗”,为下面的免疫和绿色控制提供理论基础和技术支持。

  2.3 无人系统自愈与重构控制技术

  除了持续存在的干扰和退化,突发对抗和故障也是制约无人系统安全性的重要因素。首先,干扰和故障的逐渐“同化”使得多源干扰系统复合精细抗干扰控制方法对于对抗和故障具有通用意义[24-27]。其中一个首要问题是处理干扰与故障多源性以及可能的通道与因果融合,这使得干扰和故障/攻击的信号分离成为一个关键问题。另一方面,基于干扰不变性准则的内模控制、ADRC 和 DOBC 等补偿和故障修复方法已难以满足复杂任务的要求,需要实现从“不变性”设计到“适应可变性”设计的突破[26,32]。为此,需要根据任务、环境、载荷与无人系统一体化设计,结合干扰与故障的特征和耦合关系提出具有干扰隔离能力的故障检测、诊断和容错控制方法。

  另一方面,需要根据系统构型、器件选型和典型的干扰/故障/损伤模式,研究无人系统动静混合可靠性设计方法。根据突变、干扰、攻击、故障等不确定状况,实现对任务、轨迹、决策、控制等环节的自主在线重构和优化,从传统的系统稳定性和可靠性目标拓展到系统均衡性目标[32]。总之,对于多源干扰/故障系统,未来研究工作中需要进一步突破原有干扰补偿方法的局限性,提出“适应可变性”设计准则以及多源干扰同时消纳、补偿与抑制方法,克服传统干扰不变性设计准则的藩篱,使无人系统对于干扰与故障具有自主动态调节能力。

  3 免疫控制现有无人系统过度依赖

  信息化与网络化,易于暴露、易受攻击、易被欺骗,因而在干扰对抗特别是信息拒止环境下生存能力较差。“道高一尺、魔高一丈”。传统的抗扰和容错等安全控制方法大多仅注重于客观干扰和系统内部故障的处理,无法解决抵御攻击、规避威胁和博弈竞争的问题[27-34]。

  另一方面,基于动物免疫机制的免疫算法也已在控制器设计、观测器设计、任务调度、路径规划等方面发挥了一些重要作用,但是大多局限于免疫系统神经层面的算法研究[35,36]。免疫系统的组成包括分子、组织、神经和行为等部分,动物抵御天敌、应对病毒的方式是一个包括分子识别、组织调节、神经决策和行为规避的过程。受此启发,本节从感知和规避、适应和调节、学习和进化方面提出并简述无人系统免疫智能关键技术,目标是构建具有自隐、自耐和自生能力的无人系统,探索无人系统应对干扰攻击、博弈对抗和极端恶劣环境的问题,提出在干扰对抗等复杂态势下无人系统免疫生存的新理念和新范式。

  3.1 感知和规避技术感知能力是智能系统的主要环节,动物对于病毒、天敌、环境剧变的抵御能力首先体现在对于威胁的感知和风险的预警能力。现有的无人系统感知能力受限于任务和平台载荷,大多仅适用于确定环境和预设任务。在干扰对抗环境以及“敌方”空天地一体化的监视态势下,无人系统缺乏对于干扰、攻击和威胁的识别、预警与隐蔽能力,难以快速识别、探测和预测可能的干扰和威胁,在敌方全域监视网下无所遁形。另一方面,动物在感知威胁和风险后,具有敏捷机动的隐藏规避能力。对应于病毒的隔离过程,规避也是一种具有免疫性的智能行为。

  3.2 适应和调节技术动物对于病毒侵袭、恶劣环境和伤病情况的耐受能力很强,如水熊虫具有强大的极端环境(真空、高/低温、超强辐射)耐受能力。现有无人系统技术大多依赖于结构化环境以及完备的网络和通信条件的支持,在弱支持、强干扰、非结构化环境下的自我耐受能力不足:在陌生环境、持续攻击压制情形下难以持久生存,在攻击损伤下的功能恢复与重构能力不足,在外部支援匮乏的条件下易导致资源耗尽的问题。

  3.3 学习和进化技术动物会对特定抗原产生相应的抗体,并产生记忆和遗传。现有无人系统对威胁态势感知与机动应对的学习进化能力不足,深度学习缺乏可解释性,确定学习难以揭示攻击的多样性,具体表现为对复杂多变的敌方干扰攻击态势难以记忆与预测、对抗环境下个体/群体难以动态演化。因此,无人系统需要具备对于未知攻击手段的学习、记忆和预测能力,通过离线和在线结合,数据和机理结合,实现无人系统的神经“自生”功能。对于遭受攻击或干扰的无人系统集群,可通过无人系统集群的异构分布式设计等手段形成真正的“群体免疫”。通过事件触发和拓扑生成等机制,可实现无人集群的再生和重构。相应于动物的模仿、遗传和克隆等机制,无人系统学习和进化方向未来的研究问题包括:未知信号特征的学习和预测、遗传进化的形式化建模与可信度量、陌生威胁的特征学习与记忆、分布式异构诱导与群体协同免疫进化等。

  4 绿色控制动物可以与自然和谐共存,通过冬眠、蛰伏、假死等行为来实现减缓新陈代谢、降低身体能量消耗、提高隐蔽性、甚至欺骗天敌的目的,从而提高对环境的适应能力并最终提高本身的生存能力。同样,对于极端恶劣环境和博弈对抗态势下的无人系统而言,节省能量、减少流量、降低消耗、善于隐藏就是延续生命的保障。由于无人系统受到时间、空间、物理、能量、信息等约束,因此在干扰、攻击、拒止、封锁、故障、损伤等恶劣环境下,无人系统不仅要保障抗扰与容错等安全性指标,还要在约束条件下降低“精力”和“体力”消耗,避免过度损害环境、浪费资源,实现“节能”、“节时”、“省力”、“省心”等目标。在长航时运行时减少能量消耗、在机动打击等任务中提升响应速度、在物理饱和等约束下节约控制强度、在硬件存储与处理能力受限情况下降低算法算力,从而实现环境友好型的绿色控制。同时,“双碳”目标也对未来无人系统应用提出了新要求。

  4.1 “节能”的绿色控制技术最优控制作为现代控制理论中的重要内容,已提出了基于控制和状态变量的“局部”二次型指标的能量控制方法,但并未从无人系统“感知-控制-执行-通信”全回路能量流的角度实现“全局”能量优化。从控制算法的角度,传统的抗干扰控制方法如果采用具有保守性的干扰抑制或补偿手段,也易过度消耗能源。因此,无人系统应该减少冗余和组件的使用消耗,控制和决策算法应具有“节能”特点,在处理干扰与不确定性时保证“不保守”、“不污染”、“不浪费”。其中,“不保守”是指对于干扰和不确定性特征信息的“知根知底”,充分利用先验的干扰特征进行精细补偿,不仅可以保证较好的抗干扰精度,还可以最大程度的节省能量;“不污染”是指通过干扰估计误差的量化分析,避免形成新的干扰和误差;“不浪费”是指通过明确主要干扰源,针对不同类型干扰“对症下药”,采用最小代价的精细抗干扰控制手段实现“各个击破”。

  4.2 “节时”的绿色控制技术在应对灾难和天敌侵袭时,动物具有迅疾的反应能力。因此,无人系统的绿色控制还应具有“节时”特点。传统的有限时间控制方法缺乏与机动任务、执行约束的有机结合。对于实时性需求较高的机动任务,时间成本是决定任务是否完成的重要前提。传统的最优控制理论可以求取时间最优控制器,从智能科学的角度,目前的因果控制方法还难以实现无人系统在物理约束和博弈对抗态势下的智能机动行为,这对无人系统应对复杂态势的节时控制能力提出了更高的要求。无人系统的节时控制问题包括非连续目标快速识别、有限时间跟踪控制、快响应姿态机动控制与执行方法。本团队针对空间机器人,将自适应变结构干扰观测器应用于快速干扰估计,设计了有限时间指定性能控制算法实现快速指向控制,从而解决了对收敛时间的量化问题,显著提升了系统的快速性。

  4.3 “省力”的绿色控制技术动物的迁移和抓捕对于体力和运动强度要求很高,生存能力往往得益于动物个体充沛的体力和节省体力的能力。同时,动物的寿命也往往取决于某个器官的过度劳损。因此,具有物理和能量约束的无人系统还要研究“省力”的绿色控制技术,避免器部件的过度消耗。2013 年,美国开普勒太空望远镜的四个飞轮中已有两个由于过度使用而出现故障,导致耗资 6 亿美元的航天器提前进入“安全模式”。针对干扰对抗环境下的无人系统,对某一疾病的过度治疗会带来其他器官的衰竭等并发症。现有的无人系统控制方法要么采用保守的鲁棒控制,要么采用高强度、高增益的变结构、自抗扰等控制方法,往往通过提升观测器或控制器增益来实现对某一干扰的估计、抑制或抵消,易导致大超调、过饱和、抖振等不利现象,这些“高强度”控制方法易于导致器件的磨损、退化、老化甚至失效。

  5 总结与展望

  随着智能制造、航空航天和军事装备领域的发展,卫星、导弹、无人机、无人车、无人艇等无人系统已经成为国民经济和国防安全的重要力量。然而,无人系统面临的博弈对抗态势愈发凸显,干扰、攻击、对抗、拒止、封锁、损伤等极端恶劣环境严重制约了无人系统的安全性、自主性与可靠性。2019 年,美国太空军已正式成立。2021 年 7 月,美国空间监视卫星“USA-271”故意抵近袭扰我国的“实践二十号”卫星,试图上演“太空碰瓷”事件。

  因此,对于博弈对抗等恶劣环境下的无人系统而言,从智能行为、功能和仿生智能的意义层面,生存能力比学习能力更能体现智慧性。受动物在病毒侵袭、环境剧变、天敌侵害、种群竞争等恶劣环境下的生存能力启发,本文提出了无人系统生存智能问题以及相应的赋生技术,所谓赋生也是秉承维纳、艾斯比等控制论创始人动物和机器的根本思想,视系统如生命、器件似器官;进一步,从控制理论的角度针对安全控制、免疫控制、绿色控制三个要素分别阐述了相关的基础问题与关键技术。

  总体来说,无人系统生存智能技术的研究目标是提升无人系统在干扰与故障影响下的安全性,增强博弈对抗与无支持环境下具有自隐、自耐、自生功能的免疫能力,在多约束下实现“节能”、“节时”、“省力”、“省心”性能的环境友好型绿色控制。应该指出,没有生存能力无从谈学习问题,但如无学习能力也难以保证无人系统在危险、极端、特殊、恶劣(“危极特恶”)的复杂环境下生存。作为仿生智能(包括仿生导航和仿生控制)的重要内容[41,42],“能生存”的无人系统未来将与“会学习”的无人系统一样,成为智能无人系统发展的重要方向。

  参 考 文 献

  [1]. DARWIN C. On the origin of species by means of natural selection, or the preservation of favoured races in thestruggle for life[M]. London, UK: John Murray, 1859.

  [2]. WIENER N. Cybernetics: or control and communication in the animal and machine[M]. Cambridge, MA:MIT Press, 1948.

  [3]. ASHBY W R. An Introduction to cybernetics[M].Chapman & Hall, London, 1956.

  [4]. FROESE T, STEWART J. Life after Ashby: ultrastability and the autopoietic foundations of biological individuality[J]. Cybernetics and Human Knowing, 2010,17(4): 7-50.

  [5]. HEYLIGHEN F. Cybernetic principles of aging andrejuvenation: the buffering-challenging strategy for lifeextension[J]. Current Aging Science, 2014, 7(1): 60-75.

  [6]. CHATTERJEE A, GEORGIEV G, IANNACCHIONE G.Aging and efficiency in living systems: complexity,adaptation and self-organization[J]. Mechanisms ofAgeing and Development, 2017, 163: 2-7.

  作者:郭雷 1,3,朱玉凯 2,3,乔建忠 1,3,郭康 2,4,包为民 2,3,4*

NOW!

Take the first step of our cooperation迈出我们合作第一步

符合规范的学术服务 助力您的学术成果走向世界


点击咨询学术顾问