從數據中的基於時間的模式構建預測模型。掌握統計模型,包括時間序列預測的新的深度學習方法。Python中的時間序列預測將教你從基於時間的數據構建強大的預測模型。你創建的每個模型都是相關的,有用的,並且很容易用Python實現。您將探索有趣的真實世界數據集,如穀歌的每日股票價格和美國的經濟數據,快速從基礎發展到使用深度學習工具(如TensorFlow)開發大規模模型。Python中的時間序列預測 Time Series Forecasting將教你應用時間序列預測並獲得即時的、有意義的預測。您將學習時間序列預測的傳統統計和新的深度學習模型,所有這些都用Python源代碼充分說明。通過親身參與預測航空旅行、藥物處方量和強生公司(Johnson & Johnson)收入的項目來測試你的技能。學習本書後,您將準備好使用Python生態係統中的工具構建準確和有洞察力的預測模型。

https://www.manning.com/books/time-series-forecasting-in-python-book

時間序列預測 簡短的內容

  • 第1章: 理解時間序列預測
  • 第2章: 對未來的天真預測
  • 第3章: 隨機遊走
  • 第4章:移動平均過程的建模
  • 第5章:自回歸過程的建模
  • 第6章:複雜時間序列的建模
  • 第7章:非平穩時間序列的預測
  • 第8章:季節性解釋
  • 第9章:在我們的模型中加入外部變量

成為VIP會員查看完整內容
104
0

為您提供有效閱讀論文的工具

成為VIP會員查看完整內容
84
0

《時間序列分析:預測與控製(原書第5版)》內容始終都是時間序列領域的權威。第5版仍然分為5個部分,相對第3版新增內容主要有非線性和長記憶模型、多元時間序列分析以及前饋控製,其餘各章節根據現實和教學需要均有不同程度的更新。在本書中,幾位統計學大師用極其通俗的語言,結合大量的實例,闡明了時間序列分析的精髓。本書內容十分豐富,敘述簡明,強調實際應用。相信每一位研讀此書的讀者都會獲益匪淺。

《時間序列分析:預測與控製(原書第5版)》可作為統計和相關專業高年級本科生或研究生教材,也可以作為統計專業技術人員的參考書。

這本書描述了分析離散時間序列的統計模型和方法,並介紹了方法論的重要應用。所考慮的模型包括一類自回歸綜合移動平均(ARIMA)模型和這些模型的各種擴展。對模型的性質進行了檢驗,並提出了模型規範、參數估計和模型檢驗的統計方法。介紹了非季節性和季節性時間序列的預測方法。討論了傳遞函數建模兩個或多個時間序列之間的動態關係的方法的擴展,建模幹預事件的影響,多元時間序列建模,和過程控製。主題,如狀態空間和結構建模,非線性模型,長記憶模型,和條件異方差模型也被涵蓋。目標一直是提供一個文本,是實用的和有價值的學術和實踐者。

https://www.wiley.com/en-us/Time+Series+Analysis%3A+Forecasting+and+Control%2C+5th+Edition-p-9781118675021

成為VIP會員查看完整內容
80
0

【作 者】

Michal Krelina

1 捷克技術大學核科學與物理工程學院;

2 Quantum Phi s.r.o.公司。專注於量子技術的知識、原理、學術研究、工業及其應用,重點是在國防、空間和安全領域的應用。

【關鍵詞】

量子戰爭、量子技術、量子計算、量子遙感、量子網絡、量子雷達、量子成像、軍事應用、量子安全、軍民兩用技術

【摘 要】

量子技術是一門新興且具有潛在破壞性的學科,能夠影響許多人類活動。量子技術是兩用技術,因此對國防和安全行業以及軍事和政府行為者很感興趣。本報告回顧並描繪了可能的量子技術軍事應用,作為國際和平與安全評估、倫理研究、軍事和政府政策、戰略和決策製定的切入點。用於軍事應用的量子技術引入了新的能力,提高了效率和精度,從而導致了“量子戰爭”,其中應該建立新的軍事戰略、學說、政策和倫理。本文提供了正在開發的量子技術的基本概述,還估計預期的交付時間範圍或利用率影響。描述了量子技術在各種戰爭領域(例如陸地、空中、太空、電子、網絡和水下戰爭以及ISTAR——情報、監視、目標獲取和偵察)的特定軍事應用,並闡明了相關的問題和挑戰。

圖1 利用各種量子技術係統的量子戰示意圖

1 引 言

盡管第四代現代戰爭的特點是分散化和國家對戰爭失去壟斷[1,2],但先進國家軍隊的特點是可以使用最先進的軍事技術。這包括即將出現的量子技術。

量子技術(QT)一詞指的是主要源於所謂的第二次量子革命的技術。早些時候,第一次量子革命帶來了我們今天所熟悉的技術,例如核能、半導體、激光、磁共振成像、現代通信技術或數碼相機等成像設備。第一個量子技術產生了核武器和能源;然後,經典計算機發揮了重要作用。目前,激光武器正在實施和測試[3]。

第二次量子革命[4]的特點是操縱和控製單個量子係統(如原子、離子、電子、光子、分子或各種準粒子),允許達到標準量子極限;也就是說,在量子尺度上測量精度的極限。在本報告中,量子技術一詞指的是來自第二次量子革命的技術。量子技術不會帶來根本上的新武器或獨立的軍事係統,而是顯著提高當前和未來軍事技術的測量能力、傳感、精度和計算能力以及效率。大多數量子技術通常是雙重用途的技術。因此,量子技術的軍事應用潛力巨大。各種研究和建議不斷湧現,表明實現這種技術的可能性越來越大;例如,參見[5-8]。

本報告提供了一個更深入的背景來理解“量子戰”這個術語,討論了它影響情報、安全和國防部門的可能性,並描述了新的可能的能力或改進。目標不是提供基於量子技術的精確預測,而是展示實施和應用的可能方向和趨勢。量子技術通常被認為是新興技術,具有改變戰爭行為和戰鬥結果的潛力[8]。盡管當前的量子技術大多具有較低的技術就緒水平(TRL),但它們被認為具有顛覆性潛力[9]。繪製量子技術可想象的軍事應用對於進一步評估對全球和平的威脅以及討論道德政策或基於量子的預防性軍備控製也很重要。

本報告共分八節。在第2節中,定義了量子技術和量子戰爭的術語,介紹了量子技術的分類和量子技術。第3節提供了基本的量子技術概述,它是特定應用的基礎,包括預期的部署時間和使用影響。第4節介紹了量子技術在軍事領域的發展和部署的一般考慮和期望。在第5節中,單個量子技術在軍事上的應用被介紹到不同的領域(如網絡、水下、空間和電子戰)。第6節確定並討論量子炒作以及現實的可能性。第7節初步討論了有關的軍事、和平和道德方麵以及技術後果和挑戰。第8節對本文進行總結。

第5節和第4節涉及國家安全和國防問題。雖然第3節是基於最先進的研究並提供了相關的參考資料,但第5節更多地是基於各種軍事或政府報告、政策簡報和國際安全分析,如[5-8,10-13]。在這裏,讀者應該警惕圍繞量子技術的炒作,避免誇大的期望;這方麵在第6節和[14]中有論述。對於目前提出的許多量子技術軍事應用來說,與高端軍事技術需求相關的所有挑戰是否會得到解決,甚至該技術是否會被實際部署,都是不確定的。

2 定 義

量子技術一詞的定義如下:

量子技術(QT)是一個新興的物理和工程領域,基於量子力學特性——特別是量子糾纏、量子疊加和量子隧道效應——應用於單個量子係統,並將它們用於實際應用。

從定義來看,量子技術描述了量子力學係統的各種物理原理,具有眾多應用;例如,捕獲離子技術可以用作量子計算機的量子比特,也可以用作磁場或量子鍾的量子傳感器。

兩用技術是指在國防和商業生產中具有潛在應用的研究和開發領域[15]。

量子技術是一種典型的兩用技術,不僅對軍隊而且對政府行為者[16]和維和組織都具有相當大的興趣。

量子戰(QW)是將量子技術用於影響所有戰爭領域的情報、安全和防禦能力的軍事應用的戰爭,它帶來了新的軍事戰略、學說、情景與和平以及倫理問題。

也有人嚐試將量子域[17]定義為戰爭的新域。然而,在本文中,我們將把量子技術視為改進所有當前定義的領域的一個因素,而不是作為一個獨立的戰爭領域。

隨後,定義術語量子攻擊是有幫助的,它指的是使用量子技術來破壞、破壞或竊聽經典或量子安全係統。典型的例子是使用量子密鑰分發竊聽或破壞Rivest-Shamir-Adleman (RSA) 加密方案的量子計算機。 盡管有大量的QT文獻,但對量子技術分類沒有明確的共識。我們將使用以下分類法:

  • 量子計算與模擬

量子計算機(數字和模擬量子計算機及其應用,如量子係統仿真、量子優化)

量子仿真器(非可編程量子電路)

  • 量子通信與密碼學

量子網絡與通信(量子網絡單元、量子密鑰分配、量子通信)

後量子密碼學(量子彈性算法、量子隨機數發生器)

  • 量子傳感與計量

量子傳感(量子磁力計、重力儀)

量子計時(精確時間測量與分配)

量子成像(量子雷達、低信噪比成像)

除了上述一般的量子技術分類,我們介紹了一個新的分類量子技術根據他們的利益和用途。下麵的分類可以概括為:然而,我們更重視軍事應用。量子技術利用影響的分類如下:

  • 必須性:必須實施的量子技術,以防止未來的量子攻擊(例如後量子密碼);

  • 有效性:提高當前技術和方法有效性的量子技術(如量子優化、量子機器學習或人工智能);

  • 精度:提高當前測量技術(如量子磁強、量子重力、量子慣性導航、授時)精度的量子技術;

  • 新能力:量子技術提供了超出現有技術範圍的新能力(如量子雷達、量子化學模擬、量子密碼分析、量子密鑰分配)。

請注意,這種分類不是互斥的。

3 量子技術概述

本節提供了量子技術的基本描述以及相關參考資料。對於每種量子技術,都會顯示當前的開發狀態、確定的利用影響、估計的預期部署時間、並概述了主要挑戰。對於量子計算應用,提供了所需邏輯量子比特的大致數量。

不同的量子技術及其應用處於不同的TRL從TRL 1(例如,某些類型的量子比特)到TRL 8(例如,量子密鑰分發)。

我們在此不追求完整性,也不提供任何理論背景,而隻是根據討論的軍事應用的需要介紹基礎知識、效果和當前的發展狀態。

3.1 量子信息科學

量子信息科學(QIS)是與量子物理學相關的信息科學,處理量子信息。在經典信息科學中,信息的基本載體是隻能為0或1的比特。信息的量子信息基本載體是量子比特,簡稱量子比特。一個量子比特可以|0⟩要麼|1⟩,或狀態的任意複雜線性組合|0⟩和|1⟩稱為量子疊加。

另一個關鍵特性是量子糾纏。量子糾纏是指兩個或多個量子位(或通常是兩個或多個量子係統)之間的強相關性,沒有經典的類似物。量子糾纏是造成許多量子意外的原因。另一個特點是不可克隆定理[18],它說量子信息(量子比特)不能被複製。該定理對量子比特糾錯以及量子通信安全具有深遠的影響。

量子信息科學描述了量子計算和量子通信中的量子信息流,盡管在更廣泛的意義上它可以應用於量子傳感和計量學,參見[19,20]。

有相當大的學術興趣,並且已經創建了幾種量子算法[21]。然而,預計隻有少數對國防和安全應用有價值。

3.2 量子計算

  • 現狀:商業上可用的物理量子位數量非常有限

  • 使用影響:新的能力,有效性,精確度

  • 時間線預期:10年100萬個物理量子位元

  • 主要挑戰:提高量子位的質量(相幹性,抗錯誤性,門保真度),提升量子位的數量,邏輯量子位

量子計算是指利用量子信息科學進行計算。這樣的機器可以稱為量子計算機。量子計算機的分類可能非常複雜。為本報告的目的,我們將分類簡化如下:

  • 數字量子計算機(也稱為門級量子計算機)是通用的、可編程的,應該執行所有可能的量子算法,並具有如下所述的眾多應用。經典計算機可以完全模擬基於門級的量子計算機。區別在於資源和速度。例如,完全糾纏的量子比特的模擬成倍地增加了對經典資源的需求。這意味著在經典(超級)計算機上幾乎不可能模擬≳45個量子位。

  • 模擬量子計算機(也稱為哈密頓計算)通常使用量子退火(作為絕熱量子計算的噪聲版本)來實現。量子退火器與數字量子計算機的不同之處在於量子比特的有限連接性和不同的原理。因此,模擬量子計算機的使用受到更多限製,但仍適用於量子優化或基於哈密頓量的模擬等任務。

  • 量子模擬器用於研究和模擬通常不太容易訪問的其他量子係統,並且通常被構建為單一用途的機器。與量子計算機相比,量子模擬器可以想象成一個不可編程的量子電路。

一般來說,量子計算不會取代經典計算。量子計算機僅適用於有限類型的問題,通常是高度複雜的問題。量子計算應用的實際部署取決於質量(相幹性、抗錯性、門保真度)和量子比特的數量。要遵循的一些基本參數是:量子比特的數量、量子比特相幹時間、量子門保真度和量子比特互連。在單個量子位上應用量子門的一組量子指令稱為量子電路。量子電路是量子算法的實際實現。

繼[7]之後,量子計算機可以分為三個演化階段:分量量子計算(CQC)、噪聲中等規模量子(NISQ)計算和容錯量子計算(FTQC)。CQC階段涵蓋量子計算示範和成熟的基本要素。CQC的計算能力非常有限,足以證明一些原理證明。NISQ階段的量子計算機應該有足夠數量的量子比特來展示量子計算的優勢。持續的研究應該會導致增加量子比特的數量和質量。當達到完美的邏輯量子位時,FTQC階段開始(解釋見下文)。

物理量子比特可以通過許多量子係統來實現。最新的先進技術是基於超導量子位和處於或接近NISQ階段的俘獲離子量子位的量子計算機。所有其他技術,例如冷原子、拓撲、電子自旋、光子或基於NV中心的量子比特,仍處於CQC階段或僅理論階段。各個量子計算機及其性能顯著不同(例如速度、相幹時間、糾纏所有量子比特的可能性、門保真度)。已經開發了各種指標和基準,例如Quantum Volume指標[22],用於比較。

所有類型的量子比特都存在的問題是它們的質量。量子比特非常脆弱,相幹時間有限(不會丟失量子信息的時間尺度)。在量子位上執行的每個操作都具有有限的保真度。因此,研究人員需要使用糾錯碼。量子比特的糾錯比經典比特的糾錯複雜得多,因為量子比特不能被複製,正如不可克隆定理所解釋的那樣。區分了兩種類型的量子比特:由物理量子係統實現的物理量子比特和由若幹物理量子比特和糾錯碼組成的邏輯量子比特。邏輯量子比特是完美或近乎完美的量子比特,具有非常長到無窮大的相幹時間、非常高的保真度和更高的環境電阻率。例如,[23]將需要。有關量子計算的最新概述,請參見例如[24]。

前沿量子計算機的例子是由穀歌製造的具有53個物理超導量子比特的量子計算機(該公司在2019年聲稱擁有量子霸權[25]),以及由IBM製造的量子計算機。最好的離子阱量子計算機是IonQ的32個量子位或霍尼韋爾的6個量子位。就光子量子比特而言,Xanadu有一台24量子比特的量子計算機。IBM和Google的量子計算路線圖所設想的預期時間表如下:IBM 計劃在2022年推出433量子比特的量子處理器,到2023年推出1121量子比特[26]。穀歌宣布了一項計劃,以達到10,000個量子比特的量子模塊。到2029年,所有其他量子處理器將包含多達100萬個量子比特的此類模塊[27]。根據對量子科學和技術關鍵相關領域領導者的調查,量子計算機很可能會開始變得強大到足以對大多數公鑰加密方案構成威脅(有關更多詳細信息,請參見3.2.2) 在大約20年內[28]。模擬量子計算機的例子是D-Wave Systems的具有超過5000個量子位的量子退火器和東芝的相幹伊辛機。

模擬和數字量子計算機的區別在於它們不同的物理原理和局限性。數字量子計算機受資源限製,不受噪聲限製(可以使用更多資源來校正噪聲)。相比之下,模擬量子計算機受到難以理解、控製和表征的噪聲的限製(尤其是對於量子退火器)。因此,模擬量子計算機的適用性受到限製[24]。

在現實中,量子計算機完成的任務大多隻是經典計算機程序的子程序或子程序。經典程序不僅會控製量子計算機,還會提供大量在量子計算機上執行是不切實際的計算。這包括最近使用量子模擬在化學中的應用,例如,變分量子特征求解器(VQE)[29],這是經典計算和量子計算的混合組合。此外,量子計算機是大型機器,其中許多需要低溫技術。因此,在未來幾十年中,大多數客戶不太可能購買個人量子計算機,而是將這些作為雲服務訪問。基於雲的量子計算模型(通常稱為量子計算即服務- QCaaS)如今已在商業上可用,甚至是免費的,它們允許任何對量子計算感興趣的人訪問。對量子計算機的雲訪問由各個量子硬件製造商提供。某些平台,例如Microsoft Azure Quantum或Amazon Braket,可以在一個生態係統中訪問各種製造商的量子計算機。

澄清量子霸權、優勢和實用性的術語也很有幫助。量子霸權是指量子計算機解決特定問題的速度明顯快於經典計算機的情況。然而,這個問題很可能是理論上的而不是實際的。量子優勢是指量子計算機能夠解決經典計算機無法解決的現實問題的情況。量子實用性類似於量子優勢,唯一的區別是量子計算機比經典計算機更快地解決現實世界的問題。

我們在下麵提供了可能的量子計算機應用的基本概述。讀者應該記住,量子計算是一個快速發展的領域,新的革命性量子算法仍在等待被發現。請注意,在量子計算應用的上下文中,術語“量子位”意味著一個邏輯量子位。然而,小型量子電路可以僅使用物理量子位運行,並且具有合理的精度。

3.2.1 量子模擬

  • 狀態:開發中的算法,小規模應用

  • 使用影響:新能力(例如量子化學計算)

  • 時間線預期:短期,可用性隨著量子比特的數量而增加

  • Qubits 要求:∼200(例如用於固氮問題)

  • 主要挑戰:邏輯量子比特的數量

早在第一台量子計算機誕生之前,量子計算機的主要任務就被認為是模擬其他量子係統[30]。分子就是這樣一個量子係統。盡管現有的計算能力有所提高,但可以使用當前的計算化學或以許多近似和簡化為代價對較大分子進行僅簡單分子的完全模擬。例如,對於具有n 個電子的係統,經典計算機需要位來描述電子的狀態,而量子計算機隻需要n個量子位。因此,量子模擬是量子計算機的第一個應用,也可能是最有前途的應用。

最主要的方法有兩種:量子相位估計[31]和量子變分技術(VQE)[32,33]。特別是後一種方法在NISQ計算機上成功的可能性最高。例如,在2020年,穀歌進行了迄今為止最大的量子化學模擬(使用VQE的H12分子)[34]。

正在開發用於量子化學模擬的算法。它們可以應用於更複雜的模擬,與量子比特的數量密切相關。因此,即使在量子計算的早期階段,化學和製藥行業也很感興趣。一般來說,這種模擬允許發現和設計新的藥物、化學品和材料。例如,最近考慮的主題是高溫超導、更好的電池、蛋白質折疊、固氮和肽研究。

3.2.2 量子密碼分析

  • 狀態:算法準備就緒

  • 使用影響:新功能(例如公鑰密碼方案破壞)

  • 時間表預期:中長期

  • 量子位要求:~ 6200用於2048位RSA因式分解[35],~ 2900用於256位ECDLP-based加密[36]

  • 主要挑戰:邏輯量子比特的數量

最著名的量子計算機應用之一是通過Shor算法[37]描述的指數加速對大素數進行因式分解。這對RSA、DH和ECC等公鑰密碼方案構成威脅,基於大素數乘法、離散對數問題或基於橢圓曲線離散對數問題的模式,這些模式被認為在經典計算機上難以計算或非常困難。

盡管現有NISQ量子計算機的資源遠不能滿足RSA破解所需,但威脅是真實存在的。對手或外國情報可以攔截和存儲加密流量,直到量子密碼分析可用。由於許多機密的解密時間遠遠超出了強大的量子計算機交付的預期時間表,因此如今這種威脅可以被認為是真實的。

量子密碼分析還為對對稱加密方案的暴力攻擊提供了改進的工具。例如,著名的Grover 搜索算法[38]將密鑰安全性降低了一半以對抗暴力攻擊;256位AES在大約2128次量子操作中,可以通過蠻力解決5個密鑰。盡管量子計算機需要大量資源,但建議將對稱密鑰長度加倍[39]。此外,Simon算法和疊加查詢[40]可以完全破解大多數消息認證碼(MAC)和關聯數據的認證加密(AEAD),例如HMAC-CBC和AES-GCM [41、42]。

此外,基於對稱密碼係統中存在的結構,對對稱密鑰係統的密碼分析攻擊進行了積極的研究,它可以提供高達超多項式的加速[43]。然而,這些算法對量子計算機的資源要求過高。

3.2.3 量子搜索和量子行走

  • 狀態:正在開發的算法
  • 使用影響:有效性(例如更快的搜索)
  • 時間表預期:短期至中期
  • Qubits 要求:∼100,取決於搜索的係統大小
  • 主要挑戰:邏輯量子比特的數量

最著名的搜索量子算法之一是Grover算法[38],它在數據庫搜索或反演函數中提供二次加速。對於未排序的列表或數據庫,經典的搜索算法是關於複雜度(意思是與N個實體的數量成正比),雖然 Grover 的算法大約是

量子搜索算法是所謂的大數據(非結構化數據)分析的一個重要課題。處理大量數據需要大容量的量子存儲器。然而,沒有可靠的量子存儲器可以將量子信息保持任意長時間和大量。其次,將經典數據轉換為量子形式既耗時又無效。因此,目前隻有對算法生成的數據進行搜索才被認為是可行的。 另一種搜索方法可以基於量子隨機遊走機製[44],它提供與Grover算法類似的加速。

3.2.4 量子優化

  • 狀態:開發中的算法

  • 利用率影響:有效性(例如更快地解決 NP 問題)

  • 時間表預期:短期至中期

  • Qubits 要求:∼100,取決於問題的複雜性

  • 主要挑戰:邏輯量子比特的數量

考慮到解決NP級別的可能性,量子優化是一個非常積極探索的話題複雜的問題。這種 NP問題的一個例子是旅行商問題。在這裏,給定一個地點列表和它們之間的距離,目標是找到最短(和最佳)的路線。天真地,人們可以嚐試所有可能性,但這種方法有嚴重的缺點,甚至可能變得不可能,而且複雜性越來越高。因此,最常見的解決方案是基於啟發式算法,這些算法不一定能找到最佳解決方案,但至少可以找到一個接近它的解決方案。

量子計算為這個問題引入了一個新的視角,並提供了不同的方法和技術。目前最主要的方法是基於變分方法,例如量子近似優化算法(QAOA) [45]。QAOA的一部分是稱為二次無約束二進製優化(QUBO)[46]的子技術,它也適用於模擬量子計算機。其他方法是,例如,最小二乘擬合的量子類比[47]或半定規劃[48]。 到目前為止,尚不清楚量子優化是否會比經典的啟發式方法提供一些加速。然而,人們一致認為,如果可以實現一些加速,它不會超過多項式[48]。量子計算引入的新範式導致了新的受量子啟發的經典算法,例如在QAOA[49]的情況下刪除了量子加速。另一方麵,我們可以談論量子啟發算法作為第一個量子計算實際結果。

已經有許多關於量子優化的演示、用例和概念證明,特別是與模擬量子計算相關,目前為此類應用提供最多的量子計算資源。典型的演示是對交通、物流或金融部門的優化。

3.2.5 量子線性代數

  • 狀態:開發中的算法

  • 利用率:有效性(例如更快的線性方程求解)

  • 時間表預期:短期至中期

  • 量子位要求:取決於解決的係統大小

  • 主要挑戰:邏輯量子比特的數量

已經表明,量子計算機在求解線性方程時也可以達到超多項式加速。這種加速估計尤其適用於稀疏矩陣的HHL(Harrow-Hassidim-Lloyd)[50]算法。但是,估計的加速取決於問題(矩陣)的大小。也有大量的資源需求,這對於某些問題可能被認為太不切實際[51]。另一方麵,例如對於10,000個參數的線性方程組,需要10,000步來求解它,而HHL可以在13步之後提供近似解。

目前,規劃、工程、建築和天氣預報中的許多數值模擬將複雜問題簡化為大量線性方程組。對於他們中的許多人來說,本質上是統計的,近似的解決方案可能就足夠了。

請注意,HHL算法在量子計算中被證明是通用的,並且被證明可用於各種應用,例如k均值聚類、支持向量機、數據擬合等。有關更多詳細信息,請參閱[52]。

處理大量輸入數據的量子算法的主要警告之一是數據加載。經典數據,尤其是二進製數據或比特,需要通過高效的量子算法轉換成量子態進行後續處理。這個過程很慢,並且經典數據加載本身可能需要比連貫時間更長的時間。解決方案是量子存儲器或量子RAM[52,53]。

3.2.6 量子機器學習和人工智能

  • 狀態:開發中的算法
  • 利用率影響:有效性(例如更好的機器學習優化)
  • 時間表預期:短期至中期
  • Qubits 要求:∼100,取決於問題的複雜性
  • 主要挑戰:邏輯量子比特的數量

由於圍繞經典機器學習和人工智能 (ML/AI) 的炒作,可以預期也會有關於這個主題的量子研究。首先,請注意,考慮到處理經典數據的效率非常低 [54],人們不能指望全量子 ML/AI,如果缺少量子存儲器以及經典數據(例如圖片數據)的加載和編碼速度非常慢,則更是如此) 轉換成量子信息格式。這根本不實用。當機器學習/人工智能應用於量子數據時,會出現另一種情況;例如,來自量子傳感器或成像 [55]。

盡管如此,可以引入量子增強的ML/AI [56,57],其中量子計算可以改進一些機器學習任務,例如量子采樣、線性代數(其中機器學習是關於高維線性中複雜向量的處理)空間)或量子神經網絡[54]。一個例子是量子支持向量機[58]。

事實上,ML/AI 主題涵蓋了各種技術和方法,與量子計算沒有什麼不同。量子機器學習/人工智能或量子增強機器學習/人工智能是當今許多研究工作的主題。有關量子ML/AI算法及其可能的加速的調查,請參閱[59]。

3.3 量子通信和密碼學

量子通信是指通過使用光纖或自由空間通道的量子網絡進行的量子信息交換。大多數情況下,量子通信是使用光子作為量子信息載體來實現的。然而,由於光子的限製,例如遠距離損失,量子網絡包含其他元素,例如量子中繼器或量子開關。

量子密碼學的目標是用量子密鑰分發的抗量子算法取代傳統的(主要是非對稱的)加密方案。用於量子通信的典型量子特征如下:量子糾纏、量子不確定性以及指出量子信息無法複製的非克隆理論[18,60]。

3.3.1 量子網絡

  • 狀態:研究中(僅可用於具有可信節點的QKD)

  • 使用影響:新功能、有效性(例如超安全通信、量子彈性密碼學)

  • 時間表預期:中期

  • 主要挑戰:量子中繼器和開關(量子存儲器)

量子網絡(有時稱為量子互聯網[61]或量子信息網絡(QIN))的目的是通過多種技術跨各種渠道傳輸量子信息。量子信息(量子比特)通常由單個光子攜帶,因此量子信息傳輸是脆弱的。此外,許多量子網絡應用依賴於量子糾纏。

量子信息傳輸的常用通道是專用的低損耗光纖或當前具有較高損耗的電信光纖基礎設施。兩個相互靠近的通信端點的情況就像使用一根光纖一樣簡單。網絡的複雜性隨著更多的終端節點或更大的距離而增加,其中需要諸如量子中繼器或量子開關之類的組件。請注意,對於大多數量子網絡應用來說,非常適中的(一個量子比特)量子處理器就足夠了。

自由空間量子通道更具挑戰性。由於強烈的大氣衰減,光學或近光學光子在大氣中的效用有限。因此,最普遍考慮和實現的量子網絡場景是使用量子衛星[62,63]。衛星的優勢在於可以利用光光子通信傳輸量子信息,其中衛星-地麵鏈路中的損耗低於相距較遠的兩個地麵節點之間的損耗。然而,短距離自由空間通道中的光子通信可以使用無人機等來實現[64]。最好的方法是使用經典無線通信所采用的微波頻譜。然而,在單個光子水平上使用微波光譜的通信更具挑戰性[65]。微波單光子技術在產生和檢測單個光子方麵難度更大。另一個問題是微波頻段的嘈雜環境。

由於光子損失和退相幹,長距離的量子通信需要量子中繼器。量子中繼器是一個中間節點,其工作方式類似於經典光網絡中的放大器,但需要遵守不可克隆定理。事實上,量子中繼器允許糾纏端節點的量子比特。當兩個末端節點糾纏在一起時,量子隱形傳態的效果[66] 可以被利用。這意味著可以在沒有物理發送光子的情況下傳送量子信息;隻需要經典的通信。利用量子糾纏,量子信息可以流過一個量子網絡或其中的一部分,甚至可以被竊聽者控製,而沒有任何機會泄露傳輸的量子信息。為了量子中繼器的正確運行,需要量子存儲器。然而,目前還沒有可靠實用的量子存儲器可用。

作為中間步驟,可以使用受信任的中繼器。可信中繼器不會糾纏終端節點,僅用於量子密鑰分發(QKD,參見下一節,3.3.2)。為了想象它是如何工作的,讓我們考慮兩方A和B以及一個受信任的中繼器R。然後用密鑰對密鑰進行加密。可信中繼器R對進行解密,得到。此時,受信任的中繼者R知道密鑰, A和B必須相信密鑰是安全的,不受竊聽者的控製。最後,R使用密鑰對重新加密,並將其發送給B。這是目前QKD網絡中使用的一種技術。

目前在實驗中測試的下一步是獨立於測量設備的QKD(MDI-QKD)[67,68]。它是一種量子協議,不僅可以用安全的中繼器代替受信任的中繼器(仍然不是量子,不支持糾纏),而且還可以用作交換機。這意味著可以開始構建通常的星形網絡拓撲和基礎設施。請注意,在 MDI-QKD網絡中,對中心節點的攻擊在物理上不能泄露密鑰,也不能泄露敏感信息。之後,中心節點將被量子交換機和中繼器取代,實現功能齊全的量子信息網絡。

量子網絡將與經典網絡並行工作,因為並非所有傳輸的信息都需要在量子信息中進行編碼。事實上,例如,量子隱形傳態需要並行經典網絡。量子網絡可用於以下應用:

  • 量子密鑰分發(QKD),一種加密密鑰的安全傳輸(參見第3.3.2節);

  • 量子計算機或量子計算集群之間的遠距離量子信息傳輸或遠程量子能力共享;

  • 盲量子計算[69,70]允許將量子算法傳輸到量子計算機、執行計算和檢索結果,而無需所有者或竊聽者知道算法或結果是什麼;

  • 網絡時鍾同步[71],見第3節3.4.2;

  • 安全識別[72]允許在不泄露身份驗證憑證的情況下進行識別;

  • 量子位置驗證[73]允許驗證對方的位置;

  • 用於多台量子計算機的分布式量子計算[74,75],允許將任務作為一台量子計算機進行計算;

  • 涉及所謂拜占庭協議的共識和協議任務(盡管有對手的幹預,組對一個輸出的決定問題)。與經典複雜度相比,量子版本[76]可以在複雜度上達成一致。

  • 糾纏傳感器網絡[77,78]允許提高傳感器的靈敏度並減少錯誤,並評估全局屬性,而不是收集有關係統特定部分的數據。

量子網絡允許量子計算機之間直接安全的量子通信,其中可以直接交換量子數據。這對於根據單個量子計算機性能有效地重新分配計算任務很有用,主要是當一個巨大的任務可以分成更小的任務時。另一種情況是量子雲,其中量子數據可以在多台量子計算機之間共享。此外,是否有可能構建一台獨立的高性能量子計算機是值得懷疑的。這種實現更有可能通過分布式量子計算[74,75],其中許多量子計算機將通過量子網絡連接。

3.3.2 量子密鑰分發

  • 狀態:商業可用(帶有可信賴的中繼器)

  • 使用:新能力時間線

  • 預期:短期

  • 主要挑戰:安全的量子中繼器(量子存儲器)、物理硬件的安全認證

量子密鑰分發(QKD)是量子通信最成熟的應用。目標是在兩方或多方之間為通過經典渠道分發的加密數據分發密鑰。由於不可克隆定理,任何竊聽者都必須執行通信方可檢測到的測量。

協議的主要類別有兩種:一種基於BB84 (Bennett-Brassard 1984) 協議[79],另一種基於 E91 (Ekert 1991) 協議[80]。占主導地位的BB84協議在技術上更簡單,但需要生成量子隨機數(參見 第3.3.4節),並且提供方必須在分發之前準備密鑰。E91協議利用量子糾纏在分發過程中生成密鑰,各方同時知道密鑰。在該協議中,不需要量子隨機數生成器。然而,量子糾纏的技術解決方案更具挑戰性。這兩類協議在信息理論上都是安全的。

理論上,QKD 在傳輸過程中是不可穿透的。然而,典型的攻擊向量可能集中在最終(接收器/發送器)或中間節點,其中軟件層的硬件可能包含漏洞,例如控製軟件中的錯誤、不完美的單光子源、各方驗證問題等。這是一個非常活躍的研究領域。例如,不完善的物理硬件可能被所謂的光子數分裂[81]或特洛伊木馬[82]攻擊濫用。在這裏,硬件和軟件的安全認證是必要的,並且需要時間。

除了受信任的中繼器之外,另一個弱點是量子比特傳輸速率,它太慢而無法分發長密鑰。新的單光子源的高傳輸率可以解決這個問題。

目前,QKD技術可作為短距離的點對點連接或在遠距離使用可信中繼器進行商用。值得信賴的中繼器可以是一顆太空衛星,正如中國所證明的那樣[62,63]。

3.3.3 後量子密碼學

  • 狀態:算法準備就緒

  • 使用影響:必須有

  • 時間線預期:短期

  • 主要挑戰:標準化、實施

後量子密碼學(有時稱為量子證明、量子安全或抗量子密碼學)代表了一個應該能夠抵抗未來量子計算機攻擊的加密技術領域。目前,對於大多數使用公鑰技術的非對稱加密來說,情況並非如此。另一方麵,大多數對稱密碼算法和散列函數被認為相對安全,可以抵禦量子計算機的攻擊[83]。盡管如此,建議將對稱密鑰長度加倍[39]。

現在,有幾種方法被認為是抗量子的。例如,基於格的密碼學[84]、超奇異橢圓曲線同源密碼學[85]、基於哈希的[86]密碼學、基於多變量的[87]密碼學、基於代碼的密碼學[88] 和對稱密鑰量子抗性。

與QKD不同,從數學角度來看,所有這些算法都不能證明是安全的。因此,在標準化過程中,所有這些算法都經過嚴格的測試和分析,包括實施。在最壞的情況下,經典計算機 [89]可以破解在實現中存在錯誤的抗量子算法。最受關注的標準化過程是美國國家標準與技術研究院(NIST)的標準化過程。標準化進程在第三輪[90],有三名決賽選手(基於格、基於代碼和多變量的算法)和幾個備選候選者。NIST 標準化過程預計將於 2023-24 年結束。無論如何,現在越來越多的商業供應商正在提供新的抗量子加密解決方案。

3.3.4 量子隨機數發生器

  • 狀態:市售

  • 使用影響:新功能(真正的隨機數生成)

  • 時間線預期:短期

  • 主要挑戰:提高比特率

隨機數生成器 (RNG) 對於許多應用程序來說都是必不可少的,例如蒙特卡洛模擬和集成、加密操作、統計和計算機遊戲。然而,經典計算機中的RNG,因為它是確定性的,並不是真正隨機的,被稱為偽隨機數生成。但是,對於許多應用程序,偽RNG就足夠了。

另一方麵,生成強密鑰是安全的基石,隻有真正隨機的RNG才能實現。一種解決方案是基於硬件的量子隨機數生成器(QRNG)。此外,QRNG是基於BB84的QKD協議的關鍵部分,可證明是安全的。

QRNG可用於任何密碼學,並使所有密碼學變得更好。QRNG的優點之一是它可以被驗證和認證[91],這與任何其他RNG不同。

3.4 量子傳感和計量

量子傳感和計量是最成熟的量子技術領域,它改進了時序、傳感或成像。例如,來自第一次量子革命的原子鍾已成為全球定位係統(GPS)的一部分近半個世紀。當前的量子時鍾正在提出更高的時間測量精度。

量子傳感代表所有測量各種物理變量的量子技術,例如外部磁場或電場、重力梯度、加速度和旋轉。量子傳感器可以產生關於電信號、磁異常和慣性導航的非常精確的信息。

量子成像是利用光子相關性的量子光學的一個子領域,可以抑製噪聲並提高想象物體的分辨率。量子成像協議被考慮用於量子雷達、在不透光環境中檢測物體和醫學成像。

量子傳感和計量技術依賴於以下一項或多項特征:量子能級、量子相幹性和量子糾纏[92]。單個量子傳感器具有隨應用而變化的各種指標。常用指標是:靈敏度(在1秒積分時間後給出統一信噪比的信號)、動態範圍(最小和最大可檢測信號)、采樣率(對信號進行采樣的頻率)、工作溫度、等。衍生的關鍵指標包括,例如,一定距離的空間分辨率和達到指定靈敏度所需的時間。典型的測量量是磁場和電場、旋轉、時間、力、溫度和光子計數。

3.4.1 量子電、磁和慣性力傳感

  • 狀態:實驗室原型

  • 使用影響:精度、新能力

  • 時間表預期:短期到長期

  • 主要挑戰:小型化、冷卻

許多傳感量子技術是通用的,可以測量各種物理量。每種技術的詳細描述超出了本報告的範圍;但是,提供了一個基本概述。許多應用包括各種量子技術。例如,量子慣性導航包括三種類型的傳感:加速度、旋轉和時間。一般來說,許多應用都需要精確的基於量子的定時,而不僅僅是量子技術。有關量子計時,請參閱第3節。3.4.2最有前途的技術是:原子蒸氣、冷原子幹涉、氮空位中心、超導電路和俘獲離子。

冷原子幹涉儀(測量量:磁場、慣性力、時間)。在非常低的溫度下冷卻的原子表現出類似波浪的行為,並且對與其質量相互作用的所有力都很敏感。在幹涉圖案中觀察到變化 [5,92,93]。特定的實現可以是拉曼原子幹涉法、原子布洛赫振蕩或其他形式[94–96]。例如,在重力測量中,基於量子的重力儀有可能達到大約幾個數量級的精度[5]比最好的經典同行。這種精確的重力儀可以非常詳細地繪製地球表麵和地下的地圖,分辨率達到厘米級。在慣性導航方麵,振動晶格幹涉儀有可能克服最先進的原子幹涉儀技術的缺點,可以同時用作加速度計和陀螺儀[97]。仍然存在一些挑戰。一些最大的挑戰是將量子傳感器集成到一個量子慣性測量單元中,用於冷卻原子並同時保持相幹性(抑製與噪聲環境的相互作用)的激光冷卻裝置的小型化,或動態範圍實驗室外的冷原子傳感器。然而,在這一領域也可以找到顯著的進步,例如[98]。回顧見[99]。

俘獲離子(測量量:電場和磁場、慣性力、時間)。俘獲離子是最通用的傳感平台之一 [100–102]。控製良好的俘獲離子形成具有量化運動模式的晶體。任何幹擾都可以通過這些模式之間的轉換來測量。單個捕獲的離子可以作為時間的精確測量或作為量子計算機中的量子比特。對於慣性導航,1、2和3維陣列中捕獲的冷原子的光學晶格技術可能提供亞厘米級的尺寸。除了可以測量重力和慣性參數外,它還可以測量卡西米爾力或範德華力。最近,使用量子糾纏的俘獲離子,電場測量的靈敏度已達到,這比經典對應物好幾個數量級。

氮空位 (NV) 中心(測量量:電場和磁場、旋轉、溫度、壓力)。金剛石晶體中的氮空位中心作為與外部磁場耦合的電子自旋量子比特起作用。此外,使用Berry相位的帶負電的 NV中心可以測量旋轉。一般來說,基於NV中心的傳感器可在各種條件下提供高靈敏度、廉價的生產和操作[92、104、105]。特別是,基於NV中心的技術也可以在室溫或更高溫度下工作。一種新穎的3D設計允許同時感應磁力、加速度、速度、旋轉或引力的所有三個分量[106]。NV中心在基於金剛石的傳感中的優勢在於空間分辨率和靈敏度。另一方麵,挑戰在於選擇、實施和製造單個NV中心或其整體。在電場傳感的情況下,定義靈敏度是一項挑戰[107]。

超導電路(測量量:電場和磁場)。基於約瑟夫森效應的超導電路技術描述了兩個超導體之間的量子隧道效應[92]。該技術允許在宏觀尺度上製造量子係統,並且可以通過微波信號進行有效控製。超導量子幹涉裝置(SQUID)是最好的磁力傳感器之一。然而,缺點是需要低溫技術。請注意,對於小於地磁噪聲的磁場變化的測量,首選設計是基於傳感器陣列來消除與應用的空間相關性,例如醫學和生物醫學應用(例如MRI或分子標記)。最近的發展表明,量子計算機中使用的超導量子比特也可用於測量電場和磁場[92]。

原子蒸氣(測量量:磁場、旋轉、時間)。自旋極化的高密度原子蒸氣在外部磁場下經曆狀態轉變,可以光學測量[92,108,109]。一個優點是在室溫下部署。原子蒸氣適用於旋轉傳感,稱為原子自旋陀螺儀(AGS)。AGS可以是芯片級的[5]。相比之下,最好的經典旋轉傳感器非常精確(例如環形激光陀螺儀)。預期的量子傳感器將精確到大約兩倍。然而,上麵提到的最好的經典陀螺儀的尺寸為4×4 米,這是不切實際的[110]。基於原子係綜的原子蒸汽電池磁力計有可能超越SQUID磁力計並在室溫下工作[92]。

3.4.2 量子鍾

  • 狀態:實驗室原型

  • 使用影響:精度

  • 時間表預期:短期至中期

  • 主要挑戰:小型化

原子鍾已經陪伴我們幾十年了。例如,作為GPS衛星的一部分。當前的原子鍾是基於原子物理學的,其中在改變能級時電子的電磁輻射利用“滴答聲”。因此,原子鍾是一項非常成熟的技術。今天,基於原子噴泉或熱原子束和磁態選擇原理的原子鍾可以達到相對的不確定性[111],或者最先進的芯片大小的原子鍾具有不確定性[5]。

第二次量子革命帶來了原子鍾或量子鍾的新原理。量子邏輯時鍾基於單離子,這是一種與用於量子計算的捕獲離子量子比特相關的技術[101]。量子邏輯時鍾是第一個時鍾不確定性低於[112]。量子鍾也可以從量子糾纏中受益[113]。

後來,量子邏輯時鍾被實驗光學晶格時鍾所取代。請注意,當前的原子鍾使用微波頻率工作,即能級之間的躍遷會發射微波光子。盡管它提供了更好的性能,但在光學頻率中發射光子的電平躍遷測量更難實現。光學時鍾仍在開發中,係統基於:在離子阱中隔離的單個離子、在光學晶格中捕獲的中性原子和包裝在3D量子氣體光學晶格中的原子。尤其是 3D 量子氣體光學晶格時鍾已經證明了頻率精度[114]。最近,證明量子糾纏可以提高時鍾穩定性[115]。

另一項研究側重於提供芯片尺寸實現的蒸汽電池(或氣體電池)原子鍾[116];固態(例如,鑽石中的NV中心)時鍾[117];或核鍾,其原理與微波或光學原子鍾相似,隻是它使用核躍遷而不是原子殼中的電子躍遷[118],具有超越原子光學鍾[119]的前所未有的性能潛力。

各種時鍾技術都有自己的挑戰,例如精確的頻率梳、用於控製和冷卻的激光係統以及黑體輻射偏移(在光學時鍾的情況下)。此外,小型化通常以較低的頻率精度為代價。另一種常見的挑戰是這些時鍾的同步。 精確計時對於許多技術至關重要,例如衛星導航、空間係統、精確測量、電信、國防、網絡同步、金融業、電網控製以及幾乎所有工業控製係統。然而,非常精確的時序對於量子技術至關重要,尤其是對於量子傳感和成像。例如,一個非常高精度的時鍾允許進行新的測量,例如重力勢測量到地球表麵的厘米級或尋找新的物理學。

3.4.3 量子射頻天線

  • 狀態:實驗室原型

  • 使用:有效性

  • 時間表預期:短期至中期

  • 主要挑戰:小型化、冷卻

射頻(RF)天線用作各種信號的接收器或發射器。它們可以是複雜的AESA的簡單偶極天線個模塊。它們的尺寸限製受限於產生或接收信號的波長。例如,3 GHz信號的波長為~10厘米並且天線的尺寸應不小於大約1/3這個波長的。這稱為 Chu-Harrington 極限[120,121]。

裏德堡原子的技術可以打破這一限製,並擁有一個獨立於接收信號波長的幾微米大小的天線。裏德堡原子是高度激發的原子,具有相應的大電偶極矩,因此對外部電場具有高靈敏度[122,123]。請注意,基於裏德堡原子的天線隻能接收一個信號。

最近的基於Rydberg原子的分析儀原型在0到20 GHz的頻率下用於AM或FM無線電、WiFi 和藍牙信號[124]。更多天線的組合可以檢測信號的到達角[125]。在實驗室層麵,裏德堡原子技術已商業化。

量子射頻接收器作為單個單元(用於目標頻率、窄帶寬)或陣列傳感器(寬頻率跨度)可以在導航、有源成像(雷達)、電信、媒體接收器或無源太赫茲成像中找到其應用。

3.4.4 量子成像係統

  • 狀態:實驗室原型和概念驗證

  • 使用:新能力

  • 時間表預期:短期到長期

  • 主要挑戰:提高分辨率、高倍率單光子源

量子成像係統是一個廣泛的領域,涵蓋 3D 量子相機、幕後相機、低亮度成像和量子雷達或激光雷達(對於量子雷達,請參閱第 3.4.5節)。

SPAD(單光子雪崩探測器)陣列是一種非常靈敏的單光子探測器,與脈衝照明源相連,可以測量從源到物體的飛行時間,從而測量物體的範圍。然後,將SPAD放入陣列中就可以作為3D相機工作。SPAD與擴展至近紅外光譜的光譜一起工作。

SPAD陣列也可用於檢測視線之外的物體(例如隱藏在牆角後麵)。這個想法是基於激光和相機的合作,其中激光在SPAD相機的前麵(例如地板上的一個點)發送一個脈衝。從該點,激光脈衝將向各個方向散射,包括拐角後,光子可以反射到SPAD相機前麵的點,然後再反射到相機。SPAD足夠靈敏,可以檢測到這樣的三散射信號[126]。

量子重影成像[127 –129],也稱為重合成像或雙光子成像,是一種允許對相機視線之外的物體進行成像的技術。在源中,產生了兩個糾纏的光子,每個光子的頻率不同。光學頻率中的一個由高分辨率光子計數相機直接記錄。具有不同頻率的第二光子(例如紅外線)被發送到物體。反射的光子由單光子檢測器(所謂的“桶”檢測器)檢測。然後根據兩個光子之間的相關性創建圖像。鬼成像協議也被證明沒有量子糾纏(使用經典相關),盡管分辨率較差。

這種模式允許在極低的光照水平下對物體進行成像。此外,紅外光可以更好地穿透某些環境,具有更好的信噪比(SNR)[130]。最近展示了使用 X 射線或超相對論電子的鬼成像實驗 [131,132]。

亞散粒噪聲成像[133] 是另一種量子光學模式,允許檢測信號低於散粒噪聲的弱吸收物體。散粒噪聲是檢測到的光子數量波動的結果。例如,散粒噪聲是激光的極限。使用相關光子可以克服這個限製。一個“先驅”或“輔助”光子的檢測表明存在探測物體或環境的相關光子。

量子照明(QI)[134]是一種使用兩個相關(糾纏)光子檢測目標的量子協議。保留一個稱為“閑置”的光子。另一個稱為“信號”光子,被發送到目標並被反射,兩個光子都被測量。即使糾纏被有損和嘈雜的環境破壞,該協議的優勢仍然存在。QI協議是主要適用於量子雷達的協議之一,但也可以應用於醫學成像或量子通信。

3.4.5 量子雷達技術

  • 狀態:實驗室原型和概念驗證

  • 使用:新能力

  • 時間表預期:長期和更多

  • 主要挑戰:高速率單光子源、量子微波技術

從原理上講,量子雷達的工作原理與經典雷達類似,即必須向目標發送信號,並且雷達係統需要等待反射信號。盡管如此,理論上可以通過量子力學逼近來提高精度和新能力。

有幾種用於量子雷達的協議,例如幹涉式量子雷達[135]、量子照明(QI) [134] 、混合量子雷達[136、137]或Maccone-Ren量子雷達[138]。沒有一個提到的協議是完美的。例如,幹涉式量子雷達對噪聲過於敏感,需要保留量子糾纏。QI是嘈雜環境的理想協議,甚至在實驗室驗證了微波頻譜[139],但它需要了解與目標的距離,例如它沒有測距功能。然而,基於QI的量子目標測距方法正在開發中[140]。混合量子雷達也解決了這個測距問題,但以犧牲靈敏度為代價。Maccone-Ren協議具有QI屬性和測距功能,但目前還隻是一個理論概念。

所有協議共同麵臨的最大挑戰是(不僅)微波狀態下糾纏光子的高生成率。雷達方程的量子版本[141]仍然占據主導地位,其中R是雷達-目標距離。因此,所需的糾纏光子(模式)的數量比目前可用的數量級高幾個數量級[142]。從某種意義上說,量子雷達與噪聲雷達相似,具有截獲概率、檢測概率低、頻譜共享高效等諸多特性,參見[137]及其參考文獻。

另一個相關的挑戰是目標尋找。理論工作[143]表明,量子糾纏在尋找目標未知位置方麵可以勝過任何經典策略。此外,所提出的方法可以用作固定目標範圍的量子增強頻率掃描儀。

3.4.6 其他傳感器和技術

  • 狀態:實驗室原型

  • 利用:新功能(例如化學和精確聲學檢測)

  • 時間表預期:中短期

  • 主要挑戰:提高分辨率

使用光聲檢測,量子技術可用於高達聲子水平的超精確聲音傳感,聲子是一種準粒子量化固體物質中的聲波[144,145]。聲波的精確檢測對於許多應用至關重要,包括醫療診斷、聲納、導航、痕量氣體傳感和工業過程[146,147]。

光聲檢測可與量子級聯激光結合,用於氣體或一般化學檢測。量子級聯激光器 (QCL) 是一項成熟的技術[148]。QCL是一種在中波和長波紅外波段發射的半導體激光器,與許多其他量子技術一樣,需要遠低於-70℃的冷卻。然而,最近的發展允許芯片級實現工作在-23℃ 左右,這可以通過便攜式冷卻係統來實現[149]。

4 國防中的量子技術

與工業或公共應用相比,軍事技術的要求更高。考慮到戰場上可能的部署,這需要更加謹慎。第5節介紹了具有不同 TRL、時間預期和多種實現風險的各種可能的軍事應用。

對於易於實施並適合當前技術的技術,例如量子傳感器,簡單地說,我們可以用量子傳感器代替經典傳感器,這將更簡單,風險更小。

相反,QKD是一種已經商業化但難以部署的技術的例子。需要許多新的硬件、係統和與當前通信係統的互操作性。因此,這項技術在軍事部署方麵具有更大的風險。

從長遠來看,我們可以期待降低SWaP和擴大量子計算機和量子網絡的優勢。如果國家/軍隊想與其他國家/軍隊競爭邊緣(量子)技術,這將使部署更容易並且可能是必要的。

4.1 量子策略

軍事量子技術的未來用戶將不得不仔細考慮是否、何時以及何時投入時間和資源。國防軍的目標不是開發軍事技術,而通常隻是明確要求及其獲取。但是,他們可以顯著參與開發,特別是如果他們是最終用戶。 作為基礎,最好有一個由產業和學術機構組成的國家量子生態係統。這樣的生態係統應在政府層麵得到普遍支持,即製定國家量子計劃,但也應激勵為國防部門開發技術。這可以通過適當的贈款資金甚至各種主題挑戰來實現,個人和初創公司可以參與其中,並可能帶來新的顛覆性想法和解決方案。這自然會導致與工業界和學術界的更緊密合作。量子產業非常有趣,學術界和工業界之間有大量的合作。

第一步是建立量子技術路線圖或量子戰略。路線圖/戰略應詳細說明所有後續步驟,從識別顛覆性量子解決方案、市場調查、技術和風險評估以及開發本身到原型測試和最終解決方案部署。路線圖或量子策略可以由三個部分組成:

1.鑒別,

2.發展,

3.實施和部署。

最關鍵的部分是為所考慮的戰爭領域確定最有利和最具破壞性的量子技術。此步驟還包括技術和科學評估,以平衡技術風險(有限的可部署性、低於預期的性能或不可能從實驗室轉移到戰場)與單個量子技術的潛在優勢。這個識別過程應該循環重複,以便對新發現和破壞性解決方案做出相對快速的反應。重要的是要記住許多應用程序尚未被識別或發現。

下一步是通常的研發(R&D)過程。研發應在財政上得到充分支持,但官僚障礙也應降至最低。它應該涉及快速的開發周期,並與軍事技術的最終用戶密切互動(規格和性能谘詢、原型測試、準備認證……)。在此階段結束時,新係統應具備初始運行能力。

最後一步是達到全麵作戰能力,包括修改或創造新的軍事學說,準備新的軍事情景、戰略和戰術,充分發揮量子優勢。

最後一點與識別階段有關。在這裏,決策者還需要考慮長遠的觀點。到目前為止,許多量子技術已經被單獨考慮:傳感器、QKD、量子計算等。但長期的願景是考慮通過量子網絡實現量子傳感器和量子計算的互連。在這裏,理論和實驗工作展示了利用量子糾纏傳感器和計算機的額外量子優勢[77,78]。更多類似的應用可能會被發現或發明。在構建光纖/量子網絡時要考慮這一點很重要。之後,可信中繼器等當前元素可以被全量子中繼器和交換機取代,從而充分發揮量子網絡的潛力。

4.2 TRL 和時間範圍

正如多次提到的,各種量子技術處於不同的TRL,從1到8不等。在考慮各種應用和部署平台時,尤其是用於軍事目的時,TRL的變化和時間範圍預期更加複雜。[150]中提供了一些TRL和時間範圍估計。然而,根據本報告中的描述,一些估計,例如TRL 6 的量子精確導航,似乎過於樂觀。

在這裏,我們在表1中提供了我們自己的TRL和預期時間範圍 ,這與這項工作的結果相對應。

表 1 TRL 和時間範圍預期。這些期望反映了一般 TRL 而不僅僅是軍事 TRL。請注意,各種量子技術在同一應用程序中處於不同的 TRL

讀者可以將這些與[11,150]中的其他時間線進行比較。

實際的軍事部署可能需要一些時間來克服所有技術障礙並滿足軍事要求。以用於地下掃描的量子重力儀為例。第一代可能會部署為放置在卡車上的靜態傳感器,並且範圍/空間分辨率將相當低。隨著時間的推移,下一代將提高靈敏度和空間分辨率。隨著SWaP的降低,該傳感器將能夠被放置在飛機上,然後在無人機上,也許在LEO衛星上。然而,傳感器的極限也有可能提前達到,導致部署變得不可能,例如在無人機或LEO衛星上。

4.3 量子技術對策

一個關於量子技術對策的獨立部分是有必要的,盡管這個主題將被觸及,例如在 Sect.5.6關於經典電子戰的量子類比。該主題研究較少,很少有文本涉及該主題;此外,詳細描述超出了本報告的範圍。

簡而言之,這個主題是指欺騙、禁用或破壞量子技術的方法和技術,無論是量子計算機、量子網絡還是量子傳感器和成像係統。量子技術利用了單個量子的量子物理特性。因此,它們非常容易受到來自環境的幹擾和噪音的影響,因此可能會被欺騙或癱瘓。特別是關於量子網絡,特別是QKD,我們談到了與QKD本身攜手發展的量子黑客攻擊[151–155]。

量子戰略的作者和決策者應該牢記,當量子技術部署在軍事領域時,很可能遲早會出現各種對策。目前未知的是量子技術對策的可能有效性及其影響。

5 量子技術軍事應用

量子技術有可能對人類活動的許多領域產生重大影響。對於國防部門來說尤其如此。量子技術可以影響現代戰爭的所有領域。第二次量子革命將提高靈敏度和效率,並引入新的能力和提高現代戰爭技術,而不是導致新型武器。

以下文字描繪了現代戰爭不同方麵的軍事、安全、太空和情報方麵的可想象量子技術應用,如圖1所示。它還提到了可能暗示量子技術能力和性能的工業應用,尤其是在沒有關於軍事應用的公開信息可用的情況下。

圖1 利用各種量子技術係統的量子戰示意圖

重要的是要注意,許多應用仍然是理論多於現實。在實驗室中取得的顯著量子進步並不總是在實驗室外產生類似的進步。除了工作實驗室原型之外,從實驗室到實際部署的轉移還涉及其他方麵,例如便攜性、靈敏度、分辨率、速度、穩健性、低SWaP(尺寸、重量和功率)和成本。量子技術的實用性和成本效益將決定是否製造和部署特定的量子技術。

將量子技術集成到軍事平台中更具挑戰性。除了與民用類似的主要位於數據中心的量子計算機外,量子傳感、成像和網絡的集成和部署還麵臨著軍事用途需求增加帶來的若幹挑戰(與民用/工業或科學需求相比))。例如,精確導航的軍用級要求需要快速的測量速率,這對於當前的量子慣性傳感器來說可能是相當有限的。還有更多的例子,而且可能還會有更多的例子。

此外,這個領域還很年輕,新技術的驚喜,無論是好的還是壞的,都可能帶來其他量子優勢或劣勢。

5.1 量子網絡安全

關鍵點:

  • 量子加密敏捷實施的必要性。

  • 想要利用Shor算法的操作應該在部署量子安全加密之前開始收集感興趣的數據。

  • QKD的實施需要仔細考慮。

  • 在QKD中,端點將是係統中最薄弱的部分。

網絡戰中的量子優勢可以提供新的,但一方麵非常有效(具有指數加速),對當前非對稱加密的攻擊向量(基於整數分解、離散對數或橢圓曲線離散對數問題),並且,理論上,關於對稱加密[90,156]。另一方麵是新的量子彈性加密算法和方法,以及量子密鑰分發。有關概述,請參見例如[157 –160]。 當前的趨勢也是機器學習或人工智能在網絡戰中的發展和應用[161]。有關量子機會的更多詳細信息,請參閱3.5.2 .

5.1.1 量子防禦能力

後量子密碼學實現是應該盡快實施的“必備”技術。敵對情報正在收集加密數據並期望未來使用量子計算機的力量進行解密的風險是真實的、高的並且存在的[162]。這適用於交換或存儲秘密和機密數據的軍事、情報和政府部門以及工業或學術界。當前的趨勢是,當經過認證(標準化)的後量子密碼學準備好部署時,開始準備實施量子密碼敏捷性的基礎設施 [90,156]。

新的量子彈性算法不僅可以提供一種即使對於量子計算機來說也足夠困難的新數學方法,還可以提供一種處理加密數據的新範式。例如,完全同態加密 (FHE) 允許數據永遠不會被解密——即使它們正在被處理[163]。盡管安全應用程序(例如基因組數據、醫療記錄或財務信息)被提及最多,但情報、軍事或政府應用程序也很明顯。因此,FHE 是基於雲的量子計算的良好候選者,以確保安全的雲量子計算[164]。

請注意,後量子密碼學應在物聯網(IoT)或軍事物聯網(IoMT)[165]中實施,因為這是一個快速發展的領域,存在許多潛在的安全漏洞。有關物聯網後量子密碼學的概述,請參閱 [166]。

量子密鑰分發(QKD)[160,167,168] 是另一個允許安全加密密鑰交換的新功能,其中安全性得到了數學證明。雖然不可能竊聽量子數據(密鑰)的量子載體,但由於硬件或軟件實現不完善,弱點可以在端節點和可信中繼器上找到。另一個問題是成本,如果解決方案是基於光纖或利用量子衛星,則獨立考慮量子數據吞吐量、安全性和非量子替代方案。QKD 解決方案似乎在歐盟[169]中受到青睞,而後量子加密解決方案在美國[170]中受到青睞。

最後一點是指量子隨機數生成器。QRNG提高了安全性[171]並拒絕了對偽隨機數生成器的攻擊[172]。

5.1.2 量子攻擊能力

借助Shor基於算法的公鑰加密(PKE)量子密碼分析(例如RSA、DH、ECC),攻擊者可以解密之前收集的加密數據。所謂的“Q-Day”(量子計算機破解2048位RSA加密的那一天)何時會發生,並沒有準確的預測。然而,普遍的看法是大約需要10-15年(基於2017年的一項調查)[173]。由於Simon的算法和疊加查詢,類似的威脅適用於大多數消息身份驗證代碼(MAC)和關聯數據的身份驗證加密(AEAD),例如HMAC-CBC和AES-GCM。

人們必須假設這種進攻性行動已經存在,或者正在進行深入的研究。在10年內,最敏感的通信或感興趣的主題將使用在未來六年內實施的後量子密碼學或QKD。這意味著當能夠破解PKE的量子計算機可用時,大多數安全敏感數據將使用量子安全解決方案。

理論上,Grover算法弱化了對稱密鑰加密算法;例如,DES和AES。然而,量子計算,特別是量子存儲器的需求如此巨大,以至於在未來幾十年內似乎是不可行的[174]。

另一個攻擊向量使用經典計算機的經典黑客方法,這些方法將落後於量子技術。總的來說,量子技術是一個技術年輕的領域,正在開發大量新的量子係統控製軟件。新的軟件和硬件往往有更多的錯誤和安全漏洞。例如,當前的QKD量子衛星作為受信任的中繼器工作,由經典計算機控製,可能成為網絡攻擊的理想目標。此外,針對量子網絡的特定基於物理的攻擊向量(例如QKD)是積極研究的主題[175],例如光子數分裂[81]或特洛伊木馬攻擊[82],不能排除未來的驚喜。有關量子黑客的概述,請參見例如[157]。

5.2 量子計算能力

關鍵點:

  • 量子計算能力將隨著邏輯量子比特的數量而增加。

  • 最有可能的是,量子計算將被用作混合雲的一部分。

  • 小型嵌入式量子計算係統是直接量子數據處理的理想選擇。

  • 一般用於量子優化、ML/AI 增強和更快的數值模擬。

量子計算將為當前的經典計算服務引入新的能力,幫助解決高複雜度的計算問題。此外,除了上述量子模擬之外,量子計算還包括量子優化、機器學習和人工智能 (ML/AI) 改進、量子數據分析以及更快的數值建模[11,24]。在[10]中提出了可以用近期量子計算機解決的軍事問題。它們是:戰場或戰爭模擬;無線電頻譜分析;物流管理;供應鏈優化;能源管理; 和預測性維護。

為了獲得最有效的結果,未來的量子計算實施將與經典計算機一起在計算農場中實現,這將創建一個混合係統。混合量子經典操作係統將使用ML/AI分析要計算的任務,並將單個計算拆分為CPU、GPU、FPGA或量子處理器(QPU),可以獲得最佳和最快的結果。

例如,可以放置在自動駕駛汽車或移動指揮中心中的小型嵌入式量子計算機是值得懷疑的。當前最先進的量子比特設計需要低溫冷卻。因此,更多的努力應該集中在其他量子比特設計上,例如可以在室溫下工作的光子、自旋或NV中心。嵌入式量子芯片可以執行簡單的分析任務或用於與需要直接量子數據處理的量子網絡應用相關的簡單操作。盡管如此,自主係統和機器人技術的機器學習和模型優化也可以從“大型”量子計算機中受益。

量子計算在優化問題中可能是有效的[10,176,177]。在軍事領域,量子優化的例子可以是海外行動和部署的物流、任務規劃、兵棋推演、係統驗證和驗證、新車的設計及其屬性,如隱身或敏捷性。頂部將是一個增強決策的應用程序,通過量子信息科學支持軍事行動和功能,包括預測分析和ML/AI[178]。具體來說,量子退火器已經證明了自己在驗證和驗證複雜係統的軟件代碼方麵的能力[179,180]。

量子計算機有望在指揮和控製 (C2) 係統中發揮重要作用。C2係統的作用是分析和呈現態勢感知或協助規劃和監控,包括模擬各種可能的場景,為最佳決策提供最佳條件。量子計算機可以改進和加速場景模擬或處理和分析來自 ISR(情報、監視和偵察)的大數據,以增強態勢感知。這還包括量子增強機器學習和量子傳感器和成像的參與。

量子信息處理可能對於情報、監視和偵察(ISR)或態勢感知至關重要。ISR將受益於量子計算,它極大地提高了ISR捕獲的信號和圖像中過濾、解碼、關聯和識別特征的能力。尤其是量子圖像處理是一個引起廣泛關注和發展的領域。預計在短期內,態勢感知和理解可以受益於利用神經網絡的量子圖像分析和模式檢測[13]。

量子計算將增強經典機器學習和人工智能[54],包括國防應用[178]。在這裏,量子計算肯定無法進行完整的機器學習過程。然而,量子計算可以改進ML/AI機器(例如量子采樣、線性代數、量子神經網絡)。最近的一項研究[181]表明,量子ML僅對一些適合特定問題的內核提供了優勢。原則上,量子計算可能會增強大多數經典的ML/AI國防應用;例如,自動化網絡操作、算法目標、態勢感知和理解以及自動化任務規劃[182,183]。量子 ML/AI 最直接的應用可能是量子數據;例如,由量子傳感或測量設備產生的數據[55]。實際適用性將隨著量子計算機資源的增長而增長,八年後,量子機器學習/人工智能可以成為重要的量子計算應用之一[184]。這種適用性可以通過混合經典量子機器學習來加速,其中張量網絡模型可以在小型近期量子設備上實現[185]。

通過量子神經網絡,量子計算機有望提供卓越的模式識別和更高的速度。這可能是必不可少的,例如,在保護網絡的仿生網絡防禦係統中,類似於生物有機體的免疫係統[13]。

此外,通過更快的線性代數(見3.2.5),量子計算有可能改進國防領域當前基於數值線性方程的數值建模,如兵棋推演模擬、雷達截麵計算、隱身設計建模等。

從長遠來看,量子係統可以啟用網絡量子啟用能力(NQEC)[13]。NQEC是一個未來係統,允許各個單位和指揮官之間通過網絡進行通信和共享信息,以快速響應戰場發展和協調。量子增強可以帶來安全通信、增強的態勢感知和理解、遠程量子傳感器輸出融合和處理以及改進的 C2。

5.3 量子通信網絡

關鍵點:

  • 各種安全應用(例如 QKD、識別和認證、數字簽名)。

  • 隨著對所有新技術安全方麵的仔細探索,安全應用程序的采用將很快發生。

  • 量子時鍾同步允許使用更高精度的量子時鍾。

  • 量子互聯網是量子計算機和/或量子雲之間最有效的通信方式。

量子互聯網代表具有各種服務的量子網絡[186],這些服務不僅具有重要的安全性,而且具有重要意義。然而,許多進步的量子通信網絡應用需要量子糾纏;也就是說,它們需要量子中繼器和量子開關。回想一下,可信中繼器隻能用於QKD(參見第3.3.1節)。未來光纖和自由空間通道的組合將互連各種終端節點,如無人機、飛機、船舶、車輛、士兵、指揮中心等。

5.3.1 安全應用

量子密鑰分發是最成熟的量子網絡應用之一。以後,當使用MDI-QKD或量子中繼器的長距離通信成為可能時,這項技術將對國防部門產生興趣。目前,可以使用使用可信中繼器的基本商業技術。這些先驅可以作為如何使用量子技術的典範。在這裏,QKD公司將這項技術推廣為最安全的技術,並且出現了越來越多的用例,尤其是在金融和醫療保健領域。另一方麵,眾多的推薦報告和權威機構更加謹慎;例如,英國國家網絡安全中心[187]不認可 QKD 在其當前狀態下用於任何政府或軍事應用。

除了僅分發密鑰的QKD之外,量子網絡還可用於太空、特種部隊、空軍、海軍和陸地資產之間的量子安全直接通信(QSDC)[188–191]。在這裏,在量子數據中加密的直接消息利用了類似於QKD的安全性。一個障礙可能是低量子比特率,它隻允許發送簡單的消息,而不是視聽和複雜的遙測數據。在這種情況下,網絡切換到QKD協議來分發密鑰,加密數據將通過經典通道分發。其他協議,例如量子對話[192]和量子直接秘密共享[193]旨在使用量子網絡作為QSDC進行可證明的安全通信。請注意,QKD和QSDC被認為是6G無線通信網絡的原生部分,並在[194]中進行了相應討論。

量子方法對安全性的另一個重要貢獻是量子數字簽名(QDS)[195]。它是經典數字簽名的量子力學等價物。QDS 提供安全性,防止在發送者簽署消息後篡改消息。

接下來,量子安全識別利用了量子特征,允許在不泄露身份驗證憑證的情況下進行識別 [72]。非量子身份識別基於登錄名和密碼或加密密鑰的交換,允許入侵者至少猜測誰嚐試了身份驗證。

另一個應用是基於位置的量子密碼學[196,197]。基於位置的量子密碼學可以提供更安全的通信,其中訪問的信息隻能從特定的地理位置獲得,例如隻能從特定的軍事基地與軍用衛星進行通信。當一方的地理位置是其唯一憑證時,基於位置的量子密碼學還可以提供安全通信。

5.3.2 技術應用

量子網絡將執行網絡時鍾同步[71,198],這已經是經典數字網絡中的一個主要話題。時鍾同步旨在協調其他獨立的時鍾,尤其是原子鍾(例如在 GPS 中)和本地數字時鍾(例如在數字計算機中)。使用量子糾纏的量子網絡將實現更準確的同步,尤其是在部署量子時鍾時(時間標準和頻率傳輸見第 5.4節)。否則,量子時鍾的高精度隻能在本地使用。精確的時鍾同步對於C4ISR(指揮、控製、通信、計算機、情報、監視和偵察)係統的合作至關重要,以準確同步雷達、電子戰、指揮中心、武器係統等的各種數據和行動。

一個簡短的說明專門用於盲量子計算[69,70]。這類量子協議允許量子程序在遠程量子計算機或量子計算雲上運行並檢索結果,而無需所有者知道算法或結果是什麼。當需要秘密計算(例如軍事行動計劃或新武器技術設計)並且沒有自己的量子計算機能力可用時,這是很有價值的。

通過量子網絡進行的分布式量子計算——參見第3節。 3.3.1——對於擁有量子計算機的軍事和政府行為者來說,構建高性能量子計算服務或量子雲非常重要。

能夠分布糾纏的量子網絡可以集成和糾纏量子傳感器[77],以提高傳感器的靈敏度,減少誤差,最重要的是執行全局測量。這在感興趣的參數是整個網絡的全局屬性的情況下提供了優勢;例如,當信號的到達角需要從三個傳感器測量時,每個傳感器測量具有一定幅度和相位的信號。之後,每個傳感器的輸出可用於估計信號的到達角。量子糾纏傳感器可以在全球範圍內對此進行評估。然後可以通過機器學習來改進這個過程[78]。

用於分布式計算協議的量子協議[76]可以對一群無人機或一般來說對一群自動駕駛汽車 (AV) 具有有利的軍事應用。在這裏,量子協議可以幫助在同一時間尺度上實現所有AV之間的協議,而與它們的數量無關。然而,所有快速移動的AV之間的開放空間量子通信將是一個必須首先解決的挑戰。請注意,最近成功進行了無人機量子糾纏分布的第一個實驗[64]。

5.4 量子PNT

關鍵點:

  • 所有量子 PNT 技術都有一個共同點,即對高精度量子時鍾的需求。

  • 量子慣性導航可以帶來比其經典對應物高幾個數量級的精度。

  • 量子慣性導航可以通過使用量子磁或重力映射的量子增強導航進行擴展。

  • 基於地球磁異常的有前途的量子導航。

量子技術有望顯著改善定位、導航和授時(PNT)係統,尤其是慣性導航。時間標準和頻率傳輸(TFT)是一項基本服務,可為通信、計量以及全球導航衛星係統(GNSS)提供精確計時。盡管目前的TFT係統已經很成熟,但光學原子鍾或量子鍾與利用量子網絡的TFT相結合的性能[199,200]將跟上當前應用(通信、GNSS、金融部門、雷達、電子戰爭係統)並支持新的應用(量子傳感和成像)。

新的基於量子的技術和方法支持開發用於PNT的靈敏精密儀器。量子優勢將在GPS被拒絕或具有挑戰性的操作環境中體現出來,從而實現精確操作。這種環境的示例是水下和地下,或GPS幹擾下的環境。

當前的GNSS(GPS、GLONASS、伽利略、北鬥……)依賴於通過單個衛星中的多個原子鍾提供的精確計時,這些原子鍾由地麵上更穩定的原子鍾進行校正。量子時鍾的更高精度也將提高定位和導航的準確性。從長遠來看,GNSS衛星應連接到量子互聯網以進行時間分配和時鍾同步。芯片大小的精確移動時鍾可以幫助發現GNSS欺騙和欺騙[201]。

已經考慮和研究了一些量子GNSS(不僅僅是量子時鍾);例如,幹涉式量子定位係統 (QPS)[199,202,203]。QPS[202,203]的方案之一具有類似於傳統GNSS的結構,其中有三個基線,每個基線由兩個低軌道衛星組成,基線相互垂直。然而,盡管理論上定位的準確性令人驚訝,但必須進行大量工程才能設計出逼真的QPS。

當前的大多數導航依賴於GPS,或者一般來說是GNSS,這是最精確的可用導航技術。GNSS技術容易受到幹擾、欺騙、欺騙或缺乏GPS的環境,例如使用高電磁頻譜的人口稠密地區。此外,對於地下或水下環境,GNSS技術根本不可用。解決方案是慣性導航。經典慣性導航的問題是它的漂移,隨著時間的推移精度的損失。例如,航海級慣性導航(用於船舶、潛艇和航天器)的漂移為1.8公裏/天,導航級(用於軍用飛機)的漂移為1.5公裏/小時[204]。2014年,DARPA啟動了MTO-PTN項目,目標是達到20 m和1 ms/小時的漂移[205]。即便如此,一些期望值非常高,即量子慣性導航將提供每月僅約數百米的誤差[5,206]。

全量子慣性導航係統由量子陀螺儀、加速度計和原子/量子鍾組成。盡管量子慣性導航所需的單個傳感器在實驗室外進行了測試,但創建完整的量子慣性測量單元仍然具有挑戰性。對於高度移動平台的導航,傳感器需要幾個100 Hz的快速測量速率,或者提高量子傳感器的測量帶寬[204,207]。最需要改進的關鍵部件是低漂移旋轉傳感器。經典的慣性傳感器基於各種原理[208]。一種常見的芯片尺寸技術是MEMS (Micro Electro - Mechanical Systems)技術,其中MEMS陀螺儀的不穩定性達到約,適用於軍事應用[99]。目前最好的冷原子陀螺儀的不穩定性極限約為(積分時間為1000 s)[209]。與現有實驗室實驗的精度相比,不確定性在於可現場部署的量子傳感器的精度。經典和量子慣性導航之間的中間步驟可以是融合經典和量子加速度計輸出的混合係統[210]。隨著量子慣性導航設備的尺寸減小到芯片尺寸,可以預期其部署在較小的車輛上,尤其是無人駕駛的自動駕駛汽車或導彈上。但是,我們可以達到的小型化是未知的。對於芯片大小的量子慣性導航存在諸多疑慮。盡管挑戰很大,但它無疑是下一代技術。

目前,陀螺儀或加速度計等單個元件也在各種平台上進行測試;例如,在飛機[211]或最近的[212]上。 多年來,美國國家海洋和大氣管理局(NOAA)一直在繪製地球磁異常圖並創建磁異常圖。將靈敏的量子磁力計與地球的磁異常圖結合使用是另一種實現量子非GNSS導航的方法 [213,214]。

引力圖匹配[215]的工作原理類似,人們可以期待使用量子引力計提高性能。量子重力儀和磁力儀一起可以成為潛艇量子增強導航的基礎,尤其是在海底峽穀、褶皺海床或沿海環境中。

一般來說,量子慣性導航或增強導航具有巨大的潛力,因為不需要GPS、紅外或雷達導航,而且它不易受到幹擾或一般電子戰攻擊。然而,“不需要 GPS”的說法並不十分準確。這些係統的初始位置總是需要一些外部輸入,很可能來自GNSS。

5.5 量子ISTAR

關鍵點:

  • 量子計算的密集參與以收集和處理信息。

  • 期望在低軌道衛星上部署,但分辨率值得懷疑。

  • 海底作業的廣泛應用。

  • 預期具有不確定分辨率的先進地下監視。

  • 新型 3D、微光或低信噪比的量子視覺設備。

ISTAR(情報、監視、目標獲取和偵察)是現代軍隊進行精確作戰的關鍵能力。量子技術有可能顯著提高多域戰場的態勢感知能力。

一般來說,預計量子計算會產生巨大影響,這將有助於獲取新的情報數據、處理來自監視和偵察的大數據以及使用量子 ML/AI 識別目標[178,183]。

除了ISTAR的處理部分之外,可以預期放置在單個陸地/海洋/飛行器和低軌道衛星上的量子傳感會取得巨大進步。

量子重力儀和重力梯度儀保證了高精度,可以改進或引入新的應用:地球物理學研究、地震學、考古學、礦物(裂變材料或貴金屬)和石油探測、地下掃描和精確的地理參考和地形測繪(例如,用於水下的海床導航)[7]。

另一種重要的傳感類型是量子磁力計。量子磁力測量的應用與量子重力測量的應用部分重疊,因此引入了新的應用:地球磁場包括磁異常、由於存在的局部磁異常,例如金屬物體(潛艇、礦井等),或弱生物磁信號(主要用於醫療目的的應用)[7]。

ISTAR 感興趣的第三個領域是量子成像。量子成像提供了許多不同的應用;例如,量子雷達(見第 5.7節)、醫學成像設備、3D相機、隱形測距儀等。

量子計算在 ISR 和態勢感知中的潛在應用在第3節中進行了描述。

5.5.1 量子地球的地表和地下監視

基於磁力測量、重力測量和重力梯度測量的第一級量子傳感有助於研究大陸和海麵,包括自然起源的地下變化。磁異常和基於重力的傳感都提供了地球表麵的不同圖像。地球是非常不均勻的(海洋、岩石、洞穴、金屬礦物……),包括由人類製造的巨大建築或車輛,它們會產生獨特的引力(取決於質量)和磁(取決於金屬成分)足跡。

所討論的量子傳感技術——磁力測量、重力測量和重力梯度測量——可以達到非常高的精度,至少在實驗室中是這樣。例如,實驗室外絕對重量法的精度約為[216]。請注意,靈敏度3.1 μGal對應於地球表麵上方每厘米高度的靈敏度。然而,問題在於通常與靈敏度反相關的空間分辨率(較高的靈敏度是以較低的空間分辨率為代價的,反之亦然)。空間分辨率和靈敏度是定義您將識別什麼(大規模自然變化或小型地下結構)以及距離多遠(距地麵、無人機或基於衛星的測量)的關鍵屬性。當前空間分辨率的例子是,星載重力梯度儀大約為100公裏[217],或者使用雷達衛星測高儀(海域)增加了16公裏[218]寬度,或者機載重力儀為5公裏[219]。有關更多信息,請參閱例如[5]。

對於許多量子傳感應用,必須將傳感器放置在低地球軌道(LEO)衛星上[220]。然而,目前的靈敏度和空間分辨率隻允許應用於地球監測(測繪資源,如水或石油、地震或海嘯探測)。

除了低軌道衛星外,上述量子傳感器還被考慮部署在機載、海上或地麵車輛平台上。如今,量子傳感實驗是在實驗室環境之外進行的,例如在卡車[221]、無人機和飛機[222,223] 或船上[217]上。例如,可以將量子重力儀安裝在無人機上,以搜索人造結構,例如用於走私毒品的隧道[223]。將量子傳感設備放置在無人機上(這可能是無人駕駛飛行器(UAV)、無人水麵艦艇(USV)、遙控潛水器 (ROV) 或無人水下航行器(UUV))需要更多工程才能達到最佳靈敏度、分辨率和可操作性同時進行。

低分辨率量子傳感可用於精確的地理參考和地形映射,以幫助在崎嶇地形中進行水下導航或任務規劃。此外,新礦物和油田的探測可能成為新的關注點,尤其是在海床下[224]。盡管在大多數情況下邊界是明確的,但這可能是國際摩擦的根源。

高分辨率量子磁力和重力感應[217,225–227]在許多報告和文章[7,225,228–231]中被認為能夠:檢測偽裝的車輛或飛機;有效地從LEO搜索船隊或單艘船;探測洞穴、隧道、地下掩體、研究設施和導彈發射井等地下結構;定位埋藏的未爆炸物體(地雷、水下地雷和簡易爆炸裝置);實現旋轉機械的穿牆檢測。 然而,再次注意,技術限製在哪裏以及所提到的量子重力測量和磁力測量應用是否會達到實現上述所有想法的靈敏度和分辨率(尤其是從LEO使用)是高度不確定的。量子傳感器將分多代投放市場,每代都具有更好的靈敏度和分辨率以及更低的SWaP,從而允許更廣泛的部署和應用。

5.5.2 量子成像係統

除了量子雷達和激光雷達(參見 第5.7節),還有其他與軍事相關的量子成像應用。一般來說,ISTAR 的全天候、晝夜戰術傳感用於長/短程、主動/被動狀態、不可見/隱形使用 EO/IR/THz/RF 頻率特征和優勢。量子成像係統可以使用各種技術和量子協議;例如,SPAD、量子鬼影成像、亞散粒噪聲成像或量子照明,如第3節所述。 3.4.4 一般來說,構建小尺寸的量子成像係統是沒有問題的。關鍵參數是單光子/糾纏光子發射器的通量或單光子檢測分辨率和靈敏度。此外,大規模部署具有高光子通量的量子成像係統將需要強大的處理能力,這可能會限製係統的可部署性和性能。

利用量子糾纏和光子數相關性的量子3D相機將引入具有前所未有的焦深和低噪聲的快速3D成像,旨在實現亞散粒噪聲或遠程性能。這種能力可用於檢查和檢測噴氣式飛機、衛星和其他敏感軍事技術上的偏差或結構裂縫。無人機的遠程3D成像可用於偵察和探索任務目的地或敵對設施和設備。

另一種商用技術是量子氣體傳感器[232]。從技術上講,它是一種經過校準以檢測甲烷泄漏的單光子量子激光雷達。下一個準備好的產品是能夠檢測二氧化碳(CO 2)的多氣體檢測器。通過適當的改進和校準,它也可以用於人體存在檢測。

短距離的一個特定特征是在角落後麵或視線之外的可見性的可能性,[126]。這些方法可以幫助定位和恢複被困人員、人質情況下的人,或者通過檢測拐角處的車輛來改進自動駕駛。

量子成像可以用作微光或低信噪比的視覺設備;例如,在多雲的水、霧、灰塵、煙霧、叢林樹葉或夜間等環境中,導致優勢。低信噪比量子成像有助於目標檢測、分類和識別,具有低信噪比或隱藏的可見特征,並可能對抗對手的偽裝或其他目標欺騙技術。當直升機飛行員降落在多塵、有霧或煙霧的環境中時,量子成像將非常有用[9]。

一個重要的產品將是量子測距儀[233,234]。傳統的測距儀使用明亮的激光,可以很容易地被目標檢測到。從目標觀察時,量子測距儀在時間和光譜上都無法與背景區分開來。換句話說,量子測距儀將是不可見和隱身的,包括在夜間,而經典測距儀可以對目標或其他人可見。

在某些情況下,量子鬼成像可以起到量子激光雷達的作用[235],尤其是當目標不移動或移動非常緩慢且需要無限景深進行3D成像時。

5.6 量子電子戰

關鍵點:

  • 通過更小的通用量子天線、精確的定時和先進的射頻頻譜分析儀來增強當前的電子戰。

  • 量子通道檢測的問題。

  • 當量子通道被定位時,會考慮和開發幾種類型的攻擊。

  • 量子電子戰(EW)可分為量子增強經典電子戰和專注於對抗、反對抗和支持量子通道的量子電子戰。量子通道是指攜帶用於量子互聯網、量子雷達或使用自由空間或光纖通道的其他量子係統的量子信息的任何光子傳輸。

用於電子支持措施的經典電子戰係統可以從量子天線中受益。基於裏德堡原子的量子天線可以提供與測量信號波長(頻率)無關的小尺寸[122,123]。這意味著即使對於低頻(MHz 到 kHz [124,236])信號攔截,幾微米的量子天線就足夠了。可以有一組量子天線,用於不同帶寬的多頻測量,也可以有一個天線根據興趣動態改變帶寬。此外,基於裏德堡原子的天線可以測量AM和FM信號,提供自校準,測量弱場和強場並檢測到達角[125]。未來,量子天線可能看起來像裏德堡原子細胞的陣列(矩陣)。不同的小區可以測量不同的信號,在兩個或多個小區的聯合測量中,可以確定信號的到達角。這種天線最薄弱的方麵是冷卻裏德堡原子所需的低溫技術,需要按比例縮小到可接受的尺寸。一般來說,量子射頻傳感器是先進(LPD/LPI) 通信、超視距定向射頻、抗射頻幹擾和幹擾、射頻測向或射頻-太赫茲成像。例如,陣列式量子射頻傳感器被開發為戰鬥機F-35[237]的潛在升級。

經典電子戰也可以從量子計算中受益,為電子戰提供改進的射頻頻譜分析儀,可以應用量子優化和量子ML/AI技術。通過直接處理和分析來自RF量子傳感器(裏德堡原子,NV 中心)的量子數據[55]可以獲得更高的效率,其中量子計算機的影響可能更為顯著。此外,其他基於量子的解決方案和方法正在開發中,例如基於NV中心的射頻頻譜分析或基於SHB的彩虹分析儀[238]。

當前的電子戰係統也將受益於量子計時。量子計時可以增強信號情報、反DRFM(數字射頻存儲器)和其他需要精確計時的電子戰係統等能力;例如,反雷達幹擾能力。

量子電子戰的另一個領域將是信號情報(SIGINT)和通信情報(COMINT)(檢測、攔截、識別、定位)和量子電子攻擊(幹擾、欺騙、使用直接能量武器)。量子通道(用於量子通信或量子成像)具有特定的特性。首先,簡單的信號攔截是有問題的,因為量子數據是由單個量子承載的,它們的攔截很容易被檢測到。其次,典型的量子成像技術使用低信噪比,這意味著在沒有額外知識的情況下識別信號和噪聲具有挑戰性。第三,通常用作信號的相幹光子表現得像非常聚焦的激光。在不知道至少一方位置的情況下找到這樣的量子信號非常具有挑戰性。

即使對於潛在的量子電子戰係統來說,這種情況也很困難,因為是否有可能檢測到量子(自由空間)通道的存在存在疑問。這將需要開發激光警告接收器的量子類比[239]。對於量子電子戰,使用量子通道獲取有關一方或雙方位置的情報至關重要。

經典電子戰會攔截和竊聽自由空間經典信道。然而,這對於將被迅速檢測到的量子通道來說是不可能的。一種可能的攻擊是中間人類型的攻擊[240,241],因為早期的量子網絡各方可能在身份驗證或受信任的中繼器方麵存在問題。在量子物理層麵考慮其他類型的攻擊;例如,光子數分裂攻擊依賴於將相幹激光脈衝用於量子通道[81]或特洛伊木馬攻擊[82],或散射光的收集和檢測[242]。然而,這些類型的攻擊非常複雜,它們的實用性,例如在太空中,是不確定的。

量子電子戰攻擊更有可能隻是一種拒絕服務,其中量子信道被攔截,導致信道停止使用。另一種可能性是一側或兩側接收器的複雜幹擾,導致巨大的噪聲。當接收器或發射器的位置已知時,經典電子戰的另一個對策是使用激光等定向能武器,導致傳感器損壞或破壞。這種攻擊也可以幫助竊聽者[155]。 總的來說,需要開發新的方法和方法來實現量子電子戰的能力並滿足相應的要求。

5.7 量子雷達和激光雷達

關鍵點:

  • 現有的量子微波技術不太可能實現遠程監視量子雷達。

  • 光學領域的可能應用——量子激光雷達。

  • 量子雷達可用於太空戰。

對量子雷達話題的認知[141,243,244] 受到媒體對中國量子雷達發展的炒作[245,246] 或樂觀的實驗室實驗的影響。確實,量子雷達的理論優勢和特點是顯著的(其中一些取決於單獨的量子協議):

  • 更高的抗噪聲能力——即更好的SNR(信噪比)——更高的抗幹擾能力和其他電子戰對抗能力;

  • 基於單個光子;即輸出信號功率太低,電子戰措施看不到;

  • 目標照明;也就是說,可以識別目標的雷達。

根據獨特的量子雷達功能列表,它可能是一種強大的顛覆性技術,可以改變現代戰爭的規則。因此,盡管技術不成熟,量子雷達能否作為標準的初級監視雷達存在諸多疑慮,但國際上仍對這一話題給予關注。 此外,許多人立即將量子雷達想象為具有數百公裏範圍的遠程監視雷達,而量子雷達的這種應用似乎不太可能[247,248]。這種最佳的長期監視量子雷達將非常昂貴(比任何範圍的經典雷達成本高出許多數量級)[247],並且它仍然無法滿足上麵列出的所有優勢和特性。

簡而言之,實際問題如下[247]。量子雷達也受製於雷達方程,其中接收功率隨距離的四次方而損失。同時,為了保持量子優勢,每個模式最好有一個或更少的光子。總之,需要在微波範圍內產生由低光子模式構成的相對較高的功率。這需要大量的量子信號發生器、低溫裝置、大天線尺寸等。所有這些都導致極高的成本和不切實際的設計[137,247]。科學家們需要想出更實用的量子微波技術來克服這些困難。

除了高昂的價格外,人們還對探測隱身目標或抗幹擾能力持懷疑態度。量子雷達對抗彈幕幹擾器可能有優勢,但不一定對抗 DRFM 或其他智能幹擾器[247]。綜上所述,遠程監視量子雷達即使作為一個長期前景也不太可能實現。為了實現這一目標,人們需要發展新技術,允許更小的低溫裝置、在更高溫度下工作的射頻量子發射器或更有效的低溫裝置冷卻,以及更強大的發射器(低光子脈衝的高速率)。請注意,即使開發了室溫超導材料,它也無助於產生糾纏微波光子的約瑟夫森參量放大器 (JPA) 方法[249]。然而,JPA 並不是獲得糾纏微波光子的唯一方法[137]。未來發現新的量子雷達理論和設計並非完全不可能。上述遠程監視量子雷達尺寸大、重量大、功耗大,這種雷達是否具有隱身性值得懷疑[247]。

另一個問題是量子照明(QI)協議情況下的測距。QI 協議需要事先了解目標,因此它需要對測距進行一些擴展,無論是經典的還是量子的[6]。

幾年來,人們認為量子雷達截麵 (RCS) 高於經典雷達的RCS[250,251]。對量子RCS[252]進行的一項新的精確研究表明,先前聲稱的量子RCS優於經典RCS的優勢是錯誤近似的結果。目前,量子和經典RCS似乎是平等的。

另一種方法可以是量子增強噪聲雷達[137、253、254]。噪聲雷達使用噪聲波形作為發射信號,根據發射信號與接收到的噪聲波形雷達回波之間的相關性進行檢測。優點是截獲概率(LPI)低,現在的截獲接收器幾乎無法檢測到。量子噪聲雷達設計需要更多研究才能看到實際適用性。然而,這裏的潛在用途尤其適用於微波方案。

盡管如此,目前的理論和研究在雷達領域仍有應用,尤其是使用光學或近光學光子的領域;也就是量子激光雷達。在這裏,短程量子激光雷達可用於短距離目標照明。從10[255]到45公裏[256]演示了單光子成像實驗。在這個範圍內,量子激光雷達可以作為反無人機監視雷達或作為SHORAD(短程防空)綜合體的一部分運行。

空間可以是量子雷達/激光雷達[257]有利環境的另一個例子,它對光學係統來說是低噪聲的,它甚至幾乎消除了糾纏光子情況下的退相幹問題。例如,雷神公司在空間域[258,259] 的光學狀態下對量子雷達進行了模擬。這個想法是在衛星上放置一個量子雷達,並探測由於截麵積小、反射率和環境照明條件小而難以探測到的小型衛星。為空間環境部署量子雷達/激光雷達幾乎可以提供上述所有優勢。

這裏有一個小筆記專門介紹量子增強雷達。經典雷達可以配備原子鍾或量子鍾。這種量子增強雷達顯示出高精度和低噪聲,因此在檢測小型、緩慢移動的物體(如無人機)方麵表現出優勢[260]。

5.8 量子水下戰

關鍵點:

  • 潛艇可以成為量子慣性導航的首批采用者之一。

  • 量子磁力計作為探測潛艇或水下水雷的主要工具。

量子技術可以顯著幹擾水下戰爭,增強對潛艇或水下水雷的磁探測、新型慣性潛艇導航和量子增強精確聲納。一般來說,在海洋環境中,可以應用基於量子光電探測器、雷達、激光雷達、磁力計或重力儀的傳感[257]。有關量子技術對核武器潛艇近乎無懈可擊的影響的一般概述,請參閱[261]。

潛艇和其他水下航行器將受益於 Sect 中描述的量子慣性導航。 5.4關於PNT。大型潛艇可能是量子慣性導航的首批采用者之一,因為它們有能力安裝更大的量子設備,包括低溫冷卻。此外,靈敏的量子磁力計和重力儀可以幫助繪製海底峽穀、冰山和起皺的海底等環境,而無需使用易於檢測的聲納。另一種特別適用於水下北極導航的慣性導航的例子是基於量子成像[262]。

反潛戰的基本工具可能是量子磁力計。研究人員預計,尤其是SQUID磁力計可以檢測 6 公裏外的潛艇,同時仍能改善噪聲抑製[263,264]。請注意,目前通常安裝在直升機或飛機上的經典磁異常探測器的探測範圍隻有數百米。一係列量子磁力計,例如沿海岸,可以覆蓋重要區域,從而導致潛艇無法進入區域。此外,一組量子磁力計似乎在抑製噪聲的情況下工作得更好。

量子磁力計也可用於探測水下水雷,例如,使用無人水下船隻[230]。

但是,主要討論的是檢測範圍、靈敏度等,如Sect. 5.5.1 甚至聲納等其他水下領域技術也提供了更長的探測範圍[229]。[261]中還指出,量子技術對SSBN(彈道導彈潛艇)影響不大。量子磁力計有可能與其他傳感器一起工作,以幫助檢測、識別和分類目標[229]。

5.9 量子空間戰

關鍵點:

  • 對長距離量子通信很重要。

  • 近地軌道對於未來量子傳感和成像技術的部署將很重要。

  • 太空戰將導致新的量子雷達/激光雷達和量子電子戰技術部署在太空中。

太空領域的重要性日益凸顯,將成為先進國家的重要戰場。太空過去主要用於衛星導航、測繪、通信和監視,通常用於軍事目的。如今,太空正變得越來越武器化[265];例如,帶有激光武器的衛星或“神風敢死隊”衛星被放置在地球軌道上,反衛星戰也在同步發展。另一個激增的問題是太空垃圾的數量,估計有 2,200 顆衛星,還有幾顆計劃被釋放[266]。

空間也將是在衛星中部署量子傳感和通信技術的關鍵[267–271],以及空間對策。

對於前幾節中描述的許多量子技術應用,最好將量子傳感技術(例如量子重力儀、重力梯度儀或磁力儀)放置在地球軌道上的衛星上,尤其是低軌道(LEO)衛星上。此類應用程序正在開發中;例如,一種低功率量子重力感應設備,可以部署在小型衛星上的太空中,用於準確繪製資源圖或幫助評估自然災害的影響[272]。然而,這樣的應用不需要太高的空間分辨率。見節。5.5.1進行詳細討論。這同樣適用於基於衛星的量子成像。例如,中國聲稱開發了一顆使用幽靈成像技術的間諜衛星[273]。然而,它的空間分辨率是多少尚不確定。盡管如此,量子重影成像的優勢在於可以在多雲、有霧的天氣或夜間使用。

另一方麵,已經證明利用衛星進行量子通信[62,274]。基於衛星的量子通信對於近期的遠距離集成量子網絡至關重要[275]。目前的量子通信衛星存在與光纖通道可信中繼器相同的問題。事實上,目前的量子衛星是值得信賴的中繼器。受信任的中繼器的問題在於,它們為可能對衛星控製係統進行的網絡攻擊敞開大門。目前演示的MDI-QKD協議是一種更好的安全狀況[276],其中中心點用作中繼器或開關,但處於安全狀態,後來使用量子中繼器。有關空間量子通信概述,請參見[270,271]。

一項新的所需軍事能力將是檢測其他衛星、太空物體、太空垃圾並對其進行跟蹤的技術。經典雷達用於此目的;例如,作為美國太空監視網絡一部分的太空圍欄項目[277]。然而,這些空間監視雷達中的大多數都存在尺寸約為 10 厘米或更小的物體的問題[266](在太空圍欄的情況下,最小尺寸約為 5 厘米),另一個問題是容量,如他們可以跟蹤多少個對象。大多數隻有幾厘米大小的太空垃圾就是這種情況。代替經典雷達,量子雷達或激光雷達被考慮[6,257,259]作為備選。特別是對於空間環境,考慮了光學狀態下的量子雷達[259],因為光學光子不會遭受諸如在大氣中的損失。空間量子雷達可以提供量子雷達的大部分優點,如第 3 節所述。 5.7,包括隱身。根據模擬[259],與GEODSS(陸基電光深空監視)相比,太空中的量子雷達可以提供至少一個數量級的太空探測靈敏度和目標跟蹤靈敏度。空間量子雷達對於跟蹤小型、黑暗和快速的物體非常有用,例如衛星、太空垃圾或流星體。

太空中越來越多的量子傳感和通信設備將導致人們對量子電子戰的興趣增加,如第5.6節所述。

5.10 化學和生物模擬與檢測

關鍵點:

  • ∼ 200 個量子位足以進行化學量子模擬研究。

  • 實現更複雜模擬的能力隨著邏輯量子比特的數量而增加。

  • 空氣或樣品中的化學物質檢測。

  • 適用於探測爆炸物和化學戰劑。

與國防相關的化學和生物模擬主要對軍事和國家實驗室、化學國防工業或 CBRN(化學、生物、放射和核)國防力量感興趣。基於量子模擬的新藥和化學物質研究需要先進的量子計算機、經典計算設備和量子化學專家。化學和生物化學戰劑的量子模擬原則上與民用研究具有相同的要求,例如已經在進行的蛋白質折疊、固氮和多肽研究。

所需量子比特的數量取決於空間基函數的數量(存在各種基組,例如STO-3G、6-31G 或 cc-pVTZ);例如,使用6-31G基礎,苯和咖啡因分子可以通過大約分別為140和340個量子位[278]。例如,沙林分子模擬需要大約250個量子比特。根據量子計算機路線圖[27,279] 和邏輯量子比特要求,一個人可以在10年內達到100個邏輯量子比特,但可能更早,更有效的糾錯和抗錯誤量子比特。這對於中型分子模擬來說已經足夠了。

威脅可能是新的中小型分子的結構和化學特性的設計和精確模擬,這些分子可以發揮化學戰劑的作用,例如氰、光氣、氯化氰、沙林或Yperit。另一方麵,一般來說,相同的知識也可用於CBRN對策和新檢測技術的開發。

蛋白質折疊、DNA和RNA探索的研究,如基序識別、全基因組關聯研究和從頭結構預測[280]也可能影響對生物製劑的研究[281]。然而,需要更詳細的研究來評估量子模擬的真正威脅。

使用量子級聯激光器的光聲檢測作為化學檢測器將是有效的。例如,量子化學探測器可以檢測用於非對稱衝突中常用武器的簡易爆炸裝置(IED)中的TNT和三過氧化三丙酮元素。用於檢測丙酮的同一係統可用於發現行李和攜帶爆炸物登機的乘客。一般來說,量子化學檢測可用於對抗化學戰劑或有毒工業化學品[282,283]。

從中長期來看,此類探測器可以放置在正在檢查某個區域的自主無人機或地麵車輛上 [284]。

5.11 新材料設計

關鍵點:

  • 一般研究影響;例如,允許高精度SQUID磁力計在不冷卻的情況下運行的室溫超導可以對軍事量子技術應用產生顯著影響。

  • 國防工業研究偽裝、隱身、超硬裝甲或耐高溫材料。

現代科學正在通過利用量子力學特性(例如石墨烯、拓撲絕緣體)來開發新材料、超材料,有時稱為量子材料。作為量子係統的材料可以通過量子計算機進行模擬;例如,材料的電子結構。例如,考慮的應用可以是室溫超導體、更好的電池和特定材料特性的改進。

為了更詳細地解釋,例如,室溫超導材料利用高溫下的超導性[285]。這將允許構建約瑟夫森結,通常用作SQUID或超導量子比特的構建塊。到目前為止,需要在絕對零附近進行冷卻。預計具有約70個邏輯量子比特[286]的量子計算機足以進行高溫超導體的基礎研究。

對於國防工業而言,正在考慮研究新材料的機會,例如更好的偽裝、隱身(電磁吸收)、超硬裝甲或耐高溫材料設計,但沒有透露任何細節。

5.12 腦成像和人機交互

關鍵點:

  • 量子啟用的腦磁圖

  • 增強的人機界麵

MEG(腦磁圖)掃描儀是一種醫學成像係統,它通過測量流經神經元組件的電流產生的磁場來可視化大腦正在做什麼。量子磁力計——例如,基於光泵磁力計[287]——可以實現高分辨率腦磁圖,用於實時大腦活動成像。該技術安全且無創,並且已經過實驗室測試。該技術本身很小,而且可穿戴[287]。

在短期內,量子 MEG 可以成為士兵頭盔的一部分,用於在受傷時進行連續和遠程醫療監測和診斷。長期的期望包括增強人機接口,即與機器和自治係統進行實際的非侵入性認知通信[11]。

6 樂觀與悲觀

上麵提到的許多量子技術軍事應用聽起來非常樂觀,可能會導致誇大的期望。一些應用取自各種報告和報紙或雜誌文章,其中作者可能高估了從實驗室到戰場的量子技術轉移或受到一般量子技術炒作的影響[288]。當話題涉及國家安全或國防時,避免誇大預期尤為重要。這個問題已在[14]中描述。

上述量子技術軍事應用基於公共領域的最新研究,並輔以有關國防應用的各種報告和報紙或雜誌文章。沒有針對幾種技術對其可行性進行批評性評論,因為沒有相同的公開信息。在這些情況下,讀者應該更加小心和挑剔,直到獲得更詳細的研究。

另一方麵,眾所周知,大型國防公司和國防實驗室已經進行了幾年的量子研發計劃。但是,隻有一些詳細信息是公開傳達的。相反的極端似乎包括公告,例如來自中國的公告 [245,246,263,273],在這些公告中,很難將真正的研究進展與國家的戰略宣傳[289]分開。

對於許多提到的量子技術,迄今為止隻提供了實驗室的概念證明。決定量子技術是否會在實驗室外普遍使用的決定性因素是組件的小型化和對幹擾的敏感性。這些改進不能以犧牲靈敏度、分辨率和功能為代價。實際部署的另一個決定性因素是技術的價格。

總之,考慮到過去幾年量子技術研究和支持係統的進步,例如激光和低溫冷卻的小型化,對未來的量子技術軍事應用持樂觀態度而不是悲觀是合理的(從軍事的角度來看)或政府行為者)。需要注意運營部署中的實際能力,看看它們是否滿足要求,以及性價比是否可以證明采購和部署的合理性。

7 量子戰的後果和挑戰

用於軍事應用的量子技術的開發、獲取和部署將帶來新的相關挑戰。量子戰的概念將對軍事戰略、戰術和理論、倫理和裁軍活動以及技術實現和部署提出新的要求。應該進行研究以了解量子技術發展產生的問題、影響、威脅和選擇,而不僅僅是為了軍事應用。

7.1 軍事後果和挑戰

軍事應用中的量子技術具有增強現有能力的潛力,例如通過提供更精確的導航、超安全通信或先進的 ISTAR 和計算能力。一般來說,量子戰需要更新、修改或創建新的軍事學說、軍事場景以及為量子時代開發和獲取新技術和武器的計劃。

在此之前,需要製定技術政策和戰略來響應各個參與者的戰略雄心[290]。國家技術政策和戰略應包括,例如,國家量子技術資源(大學、實驗室和公司)和市場的研究、發展狀況和可行性研究以及軍事和安全威脅和潛在評估,例如[261]。

監測量子技術的演變和適應對於避免鄰國或潛在敵對國家造成的技術意外至關重要。即使量子技術超出了某些國家的財政、研究或技術能力,量子戰監測也是必不可少的。因此,所有現代軍隊都應該對量子戰可能產生的影響感興趣。

國家貿易和出口政策也很重要。例如,歐盟已宣布量子計算是一項具有全球戰略重要性的新興技術,並正在考慮對名為Horizon Europe[291]的研究計劃的訪問進行更嚴格的限製。此外,中國還禁止出口密碼技術,包括量子密碼技術[292]。

另一個話題是與盟友仔細溝通重要的量子優勢,特別是在量子ISTAR和量子網絡能力方麵,這些能力可以揭示軍事機密,例如機密文件、核潛艇的位置或地下設施。力量平衡的重大破壞可能會擾亂盟友以及中立或敵對玩家[9]。

7.2 和平與倫理的後果和挑戰

迄今為止,量子技術的軍事應用已被繪製在Sect中。 5不引進新武器,即使它們提高了現有的軍事技術;例如,通過開發更精確的傳感和導航、新的計算能力和更強的信息安全。然而,量子技術,特別是用於軍事應用,對世界和平是好是壞的問題是相關的。

已經出現了對量子計算[293–295]道德準則的各種呼籲,其中提到了道德問題,例如人類DNA操縱、為戰爭創造新材料和侵入性人工智能[294]。

盡管量子技術不會產生新武器,但它們對現有軍事技術的改進將提高這種能力,縮短攻擊、警告和決策的時間。因此,即使在降低個人風險的同時,量子技術也可以更有可能使用武力[296],從而使戰爭更有可能發生[297,298]。

諸如量子技術等通用兩用技術的預防性軍備控製將更加困難,因為它們也可以用於民用應用,例如用於醫學的量子傳感。已經與納米技術進行了類比[299]。防止或減緩其他國家或非國家團體的擴散和軍事使用的出口管製是試圖減少量子技術構成的任何威脅的最有可能的方式[298]。

具體來說,量子計算的研發成本非常高。然而,目標是開發一種允許簡單可靠的量子比特生產的技術。這可以為技能較少的參與者帶來更便宜、更廣泛分布和更容易獲得的技術,這是即將出現的有問題的軍事技術的一個特征[298]。

7.3 技術後果和挑戰

將成功的實驗室概念驗證轉移到真正的“外部”應用麵臨許多技術和技術挑戰,例如小型化和可操作性,而不是以實驗室實現的靈敏度和分辨率為代價。此外,還有其他相關的技術挑戰。

一個重要的問題可能是量子勞動力。量子勞動力不需要包括物理學家或擁有博士學位的科學家。但是,他們應該是具有量子信息科學知識和量子技術概述的量子工程師,能夠理解並能夠處理和評估來自量子傳感器、計算機和通信的傳出數據。目前,現有的量子生態係統正在不斷增長,這個生態係統將需要越來越多的量子勞動力[300]。這需要培訓和教育新的量子工程師和專家;也就是說,更多的大學提供量子課程,更多的學生選擇學習這些課程。此外,讓這些人在軍隊工作可能更加困難。因此,量子信息和量子技術的基本原理也應該成為現代軍隊軍事學院課程的一部分,量子技術已經或將要部署的地方。

另一個技術挑戰將是海量數據。量子技術通過所有的量子傳感器、量子成像、量子通信和計算,將產生大量經典和量子數據,這將增加對數據傳輸、處理和評估的要求。在規劃 C4ISR 和量子基礎設施期間應考慮這些要求。

最後的挑戰將是標準化。標準化過程對於不同生產商製造的設備的互操作性很重要。除了統一接口和通信協議,標準化過程還可以包括安全驗證,例如在後量子密碼標準化過程中[90]。在量子網絡的情況下,特別是各種連接的設備(如節點、中繼器、交換機、光纖通道和開放空間通道)可以預期,因此開發和實施一些允許成功傳輸的標準非常重要量子信息。

8 結論

量子技術是一個新興的技術領域,它利用對單個量子的操縱和控製來實現具有顛覆性潛力的多種應用。這些應用中有許多是雙重用途或直接用於軍事目的。但是,從TRL 1(觀察到的基本原理)到TRL 6(在相關環境中展示的技術),單個量子技術處於用於軍事用途的 TRL。

用於軍事應用的量子技術不僅將提供改進和新的能力,而且還需要製定新的戰略、戰術和政策,評估對全球和平與安全的威脅以及識別道德問題。所有這些都包含在“量子戰”一詞中。

在本報告中,描述了不同TRL的各種量子技術,重點關注在國防領域的可能利用或部署。由於從實驗室到現實世界應用的過渡尚未實施或正在進行中,因此無法準確預測量子技術的部署。這引發了一些問題,例如我們是否能夠達到提供真正量子優勢的解決方案,而經典係統通常要便宜得多,而且通常已經在行動。盡管對量子技術可能的軍事應用的描述聽起來非常樂觀,但人們應該警惕量子炒作,並提請注意實際部署量子技術用於軍事應用之前麵臨的挑戰。

量子技術有望產生戰略和長期影響。然而,技術意外影響軍隊和國防力量的可能性相當低。避免意外的最好方法是培養量子技術知識和監控量子技術的發展和就業。用心對待量子技術,將起到量子保險的作用。

成為VIP會員查看完整內容
中文版——最新《量子技術在軍事中的應用》綜述論文,Quantum Phi s.r.o.公司、捷克技術大學.pdf
86
0

摘要

幾十年來,政治科學家和國家層麵的軍方政策製定者一直在戰略層麵使用博弈論,但對其在作戰層麵的使用幾乎沒有評論。傳統上,三個主要挑戰阻礙了規劃人員和分析人員在作戰層麵使用博弈論,即複雜的作戰環境、參與者的動態交互以及大多數陸軍參謀人員不具備使用複雜數學技能。

這本專著表明,這些挑戰是可以克服的,博弈論可以在規劃過程中提供新穎的見解。美陸軍參謀部規劃人員可以在作戰層麵有效地使用基本博弈論和簡單的數學來了解作戰環境、了解行動者及其動機,並在軍事決策過程中比較行動方案。本專著展示了如何避免高級博弈論用於解決理論問題的繁瑣數學程序,而是專注於使用基本博弈論在操作過程中提供價值。它通過回顧博弈論在戰略層麵的應用、教授基本博弈論和涵蓋一些基本博弈來展示博弈論的實用性。然後,它考察了一場曆史性的運動,以展示博弈論的使用將如何達到另一個推薦行動方案和結果,也許會改變曆史進程。最後,它通過將博弈論應用於軍事決策過程、任務分析和行動製定過程的兩個步驟的練習,提供了使用博弈論的指南。

引言

幾十年來,戰略規劃者和政策製定者在戰略層麵有效地應用了博弈論,但軍事從業者往往不在作戰層麵使用它。當約翰·馮·諾依曼和奧斯卡·摩根斯坦在 1940 年代初在蘭德公司工作期間發展博弈論時,他們尋求一種數學方法來為衝突領域,特別是經濟衝突提供解決方案。他們於 1944 年發表了開創性的著作《博弈論與經濟行為》

博弈論允許通過將場景建模為簡化的博弈來分析決策。博弈論試圖定義參與者、策略——或可供他們選擇的選項——以及博弈結果的預期回報。它試圖澄清由於參與者的選擇而導致的不確定性。它的主要用途是它認識到結果是通過多個參與者的互動共同決定的,而不僅僅是一個人自己決定的結果,它允許分析對手可能會做什麼。由於這些原因,政策製定者和戰略家使用博弈論來理解戰略問題,例如核對手、貿易慣例、內戰解決和裁軍以及缺乏國際合作,從而製定政策建議以幫助解決這些問題

作戰層麵的規劃者是否可以有效地應用博弈論仍然是一個懸而未決的問題。在作戰層麵使用博弈論的批評者強調了動態交互的複雜性。他們指出,培訓軍官了解博弈論的基本概念並將操作層麵問題的複雜性提煉成基本博弈需要大量時間。

本專著認為博弈論提供了一個有價值的框架,最適用於在軍事決策過程的任務分析和行動發展步驟過程中理解環境中的參與者。博弈論旨在提供對情況的理解。這需要了解參與者及其潛在計劃或戰略動機。博弈論提供了一種理性的方法來研究行動者如何製定他們的策略和他們的動機基礎。由此,指揮官和參謀人員可以獲得理解,然後疊加其他因素,包括行動方案和潛在結果。它提供了一種合理而直接的方法來簡化複雜的問題。因此,博弈論為作戰規劃者提供了另一種工具,可用於了解作戰環境。

本專著重點介紹博弈論在戰略層麵的曆史應用、當前的規劃過程學說和相關框架,以回答作戰規劃者能否在作戰層麵有效地使用博弈論。這本專著主要通過囚徒困境分析博弈論在戰略層麵的應用,將其應用於冷戰、國際貿易和價格戰期間的降價。 1777 年的新澤西戰役為應用博弈論和理解喬治華盛頓將軍和查爾斯康沃利斯將軍之間的競爭環境提供了一個曆史例子。最後,它演示了如何以及在何處將博弈論工具實施到美國陸軍當前使用的規劃過程中。所使用的博弈論是一種基本的應用方法,而不是過於複雜和無用的高級學術博弈論。簡單的博弈可以使複雜的操作情況變得清晰。該研究回顧了陸軍規劃學說,以專注於了解作戰環境和問題。任務分析旨在了解環境中的參與者以及他們之間衝突的根源。這 3 項研究的重點是深入了解對抗性和中立的參與者、激勵措施、潛在的行動方案和回報。該專著追溯了博弈論的戰略應用和作戰應用之間的差異,以了解哪些要素是一致的,同時說明了差異。最後,它將討論如何克服實施中的潛在挑戰

博弈論在軍事決策過程中的應用

規劃人員可以在軍事決策過程中使用博弈論工具,特別是在任務分析期間,以不同的視角理解作戰環境和行動發展過程,以檢查未發現的假設。博弈論工具不是替代軍事決策過程中現有的步驟和工具,而是對其進行補充。戰地手冊 6-0 解釋說,指揮官和參謀人員使用任務分析來更好地了解作戰環境和部隊麵臨的問題。接下來,規劃人員使用任務分析來製定假設以填補知識空白。最後,考慮到博弈論理解競爭的本質,任務分析也有助於理解友軍和敵軍如何互動。行動方案製定過程提供了一種客觀的方式來看待多個潛在計劃。在上麵的曆史例子中,華盛頓將軍和康沃利斯將軍需要了解他們的潛在行動以及他們認為 30 名敵方指揮官可能會做什麼。在某種程度上,曆史例子中的將軍們可以在他們的行動發展過程中使用博弈論來檢查他們的假設。開發從敘述性或定性評估開始,然後轉向帶有每個計劃的加權分數的可量化評估。博弈論允許另一種觀點來評估潛在的計劃。以下思想實驗提供了一個示例,說明工作人員如何在任務規劃期間使用一些博弈論工具。

演習如下:美國討論在一個靠近對手的友好國家增加軍事存在,這旨在阻止對手入侵友好國家。軍團工作人員了解國家決策者關於在一個地區增加軍事存在的辯論。此外,他們知道如果國家領導層追求升級,軍團是升級的一個因素。工作人員致力於了解作戰環境並了解國家層麵的優先事項和激勵措施,以便他們可以就選項提出更高的建議並為預期的行動方案做好準備。其次,他們努力了解敵人的動機和行動計劃。敵人還麵臨著增加其在該地區的軍事存在或維持現狀的前景。兩國都擁有核武器,都不想進行全麵戰爭。最後,兩個大國都可以遷移的地區的人口不希望被外國勢力占領。國家決策者麵臨的戰略決策具有操作層麵的影響。

如上所述,任務分析提供了對情況和問題的理解。在任務分析過程中,工作人員開始對行動者的動機和動機有所了解。戰場情報準備是任務分析的關鍵步驟。參謀人員對友軍和敵軍如何在環境中相互作用做出假設。由此,工作人員開發了每個參與者在即將到來的操作中可以使用的潛在選項。此外,情報準備步驟確定了指揮官和參謀人員的知識差距。這些差距導致了獲取信息的情報需求的發展。正如文獻回顧中所述,人們根據他們擁有的信息做出決策,並預測競爭對手的行為。這些步驟不會取代或否定軍事決策過程的任何步驟,它們隻是關於如何以及在何處實施博弈論工具的建議。

鑒於這種情況,參謀人員開始製定敵人的行動方案。當應用於博弈矩陣時,這些行動方案成為敵人的策略。敵人可以用他們的一個師或軍將該地區軍事化,也可以選擇不軍事化。是否軍事化的選擇為敵人創造了兩種不同的戰略。第二步著眼於每個策略的結果。如果雙方都軍事化,那麼他們將麵臨戰爭。如果雙方都沒有軍事化,那麼他們就維持現狀。如果一個國家軍事化而另一個國家不軍事化,那麼軍事化的國家就會在沒有爭議的環境中這樣做。表11顯示了這種情況的結果。

表11:定性結果

第三步要求參謀人員查看敵人的動機,然後對他們的選擇進行定性分析。敵人想在美國不決定將該地區軍事化的情況下將該地區軍事化。這為他們創造了一個無可爭議的環境。其次,他們既不看重自己也不看重美國將該地區軍事化,這是現狀。第三個可取的結果是美國軍事化,而敵人沒有,這意味著美國擁有無可爭議的軍事化。最後,如果美國也進行軍事化,敵人不想升級為戰爭,也不想將該地區軍事化。工作人員現在可以根據偏好對敵人的行動路線進行排序。作戰和情報人員可以利用收集資產並製定收集計劃,以確定有關敵人計劃的任何指標,例如在該地區集結部隊。信息收集計劃有助於回答信息需求並協助進行有效規劃。

工作人員現在進入行動開發過程。生成選項步驟概述了指揮官和參謀人員可用的選項。工作人員製定了可以切實擊敗敵人行動方案的選項,然後確定它們的優先級。工作人員還產生了兩個廣泛的選項。他們可以軍事化,也可以不軍事化。由於每個參與者的策略,工作人員現在可以對他們的行動方案進行排序。指揮官和參謀更願意維持現狀。如果美國采取行動將該地區軍事化,它可能會擾亂地方、國家政府和民眾。因此,美國對該地區的軍事化和一個不軍事化的敵人是次要的選擇。這種選擇意味著美國擁有無可爭議的軍事化,但正如所述,當地政府感到不安。第三,排名是美國不軍事化,但敵人軍事化,給了他們無可爭議的優勢。最後,美國不希望發生戰爭,如果美國和敵人都進行軍事化,就會發生戰爭。

接下來,工作人員將博弈發展為矩陣或戰略形式。首先,他們進行定性分析,說明每次交戰的可能結果,見表 12。然後參謀人員從每個指揮官的角度對結果進行排序,以生成定量分析和回報,如表 13 所示。該表顯示了回報敵方第一,美國第二。使用倒序排列,最低數字的收益表示排後的選項,數字越大,表示首選的選項。每個戰鬥人員都是近鄰,因此參謀人員認為交戰將有利於主動一方。

表12 :定性分析

表13:定量結果

這兩種的價值在於員工進行分析以掌握對潛在未來結果的理解。它提供了一個簡潔的可交付產品,參謀計劃人員可以在一張紙上將其交給指揮官或參謀長,以供將來參考或思考,因為指揮官和參謀人員開始在軍事決策過程的未來步驟中權衡選項。這種分析為員工提供了一個思考他們正在做什麼以及他們的計劃可能產生什麼結果。這是舍恩所說的實踐中反思的一個例子。正如他所說,它允許人們在執行任務時思考他們正在做什麼,然後塑造他們所做的事情。

下一步要求參謀人員將可用選項縮小到隻有指揮官可用的可信選項。參謀部尋找指揮官永遠不會使用任何主導策略。敵方指揮官沒有任何主導策略,並且兩種策略都可供他使用。但美國永遠不會在博弈中選擇軍事化,因為無論敵人選擇什麼,不軍事化都會主導博弈。表 14 以粗體突出顯示哪個選項在美國占主導地位。例如,如果敵人決定軍事化,如果它決定軍事化,美國將獲得 1 的回報,否則將獲得 2 的回報。因此,在這種情況下,美國會選擇不進行軍事化。同樣,如果敵人不軍事化,那麼如果它軍事化,美國將獲得三倍的回報,如果它不軍事化,美國將獲得四倍的回報,美國將再次選擇不進行軍事化。因此,工作人員將其排除在外。

表14:以粗體突出顯示的美國的收益

既然參謀人員了解美國沒有軍事化的動機,它就可以看看敵人可能會采取什麼行動作為回應。敵人知道美國不想軍事化,並尋求使其結果最大化。因此,敵人選擇軍事化,因為這比不軍事化帶來更好的回報。這達到了納什均衡,即敵人軍事化並獲得四分之二的回報,而美國不軍事化並獲得三分之二的回報。表 15 顯示了圈出的所得納什均衡。

表15:軍事化為主

但現實生活中的情況並不總是一致的。一方通常首先采取行動,迫使另一方做出決定。在上述情況下,美國正在努力應對將該地區軍事化的決定。然後他們的決定迫使敵人做出決定。下一步著眼於在順序移動遊戲中情況如何展開,以及納什均衡在決策分析中是否發生變化。順序博弈見表 16。該表首先顯示了敵人的收益,其次是美國的收益。

表16:順序多次博弈

參與者對每個結果的選擇和回報保持不變。唯一的區別是美國先行動,敵人必須做出反應。工作人員必須使用子博弈分析來分析這個博弈及其結果。敵人有第二步,因此分析從他們的預期步驟開始。這兩個參與者都知道,如果美國選擇軍事化,敵人將選擇不軍事化,因為兩個人的回報比一個人要好。如果美國選擇不軍事化,敵人會想要軍事化,因為四比三好。鑒於美國的選擇,上麵的表 16 通過圈出每個敵人的首選選擇來表明這種行為。既然美國知道敵人會根據美國的選擇做出哪些選擇,他們就會在兩者之間做出選擇。美國選擇軍事化,知道敵人不會軍事化,從而為美國帶來三倍的回報。美國軍事化總比不軍事化並獲得兩個回報要好,因為知道敵人會選擇軍事化。因此,納什均衡變成了美國軍事化和敵人不軍事化,敵方兩分,美國三分,見表 17。

表17:納什均衡

序列博弈導致的納什均衡與同步博弈不同,為什麼?每場比賽都會導致一方軍事化,而另一方不軍事化。在同步博弈中,敵人通過軍事化獲得了最有利的回報,美國知道這一點,因此選擇不軍事化。然而,在順序博弈中,美國先決勝負。如果他們不軍事化,他們將獲得最高的回報,而敵人也選擇不軍事化。兩國都不會軍事化,因為如果美國不軍事化,敵人就有動機進行軍事化。美國意識到這一點,因此認為他們的下一個最佳選擇是軍事化,因為它知道敵人不會軍事化,因為這會迫使兩個參與者之間發生戰爭。這個遊戲提供了一個先發優勢的例子。如果敵人先選擇,他們也會有軍事化的動機

序列多次博弈反映了更現實的情況。但是運行這兩種類型的博弈為工作人員了解動機和潛在行動提供了分析價值。工作人員可以看到排序操作如何改變結果。如上所述,使用這種方法的價值在於分析。工作人員可以按照矩陣形式對每個結果進行簡要說明。然後他們可以看到他們的選擇之一不是一個可行的選擇。然後,他們查看了定量評估並確定可以使用平衡結果。所進行的定性分析重申了 Thomas Schelling 的觀點,即博弈論的數學並不總能解決衝突,不應過度依賴數學。而是對問題的思考增加了價值。

結論

博弈論提供了一種分析工具來看待競爭情況。它使分析師能夠了解潛在的行動計劃、激勵措施以及回報或結果。此外,它可以突出信息差距和需要進一步理解的領域。在 20 世紀中葉,戰略層麵的規劃者用它來更好地了解美國和蘇聯之間在使用核武器和原子戰方麵的競爭。國防部以外的分析師使用它來了解競爭公司之間的貿易爭端和降價。

在作戰層麵,博弈論允許對潛在計劃、激勵和結果進行相同類型的分析和理解。這本專著審視了博弈論的曆史並探索了基本的博弈論,確立了博弈論在分析衝突情況方麵的有用性。文獻回顧揭示了博弈論的優勢和劣勢,這為如何最好地利用它以最大限度地發揮其潛力提供了信息。檢查諸如核局勢和國際貿易等戰略層麵的決策為以前的努力如何有效地應用博弈論提供了背景。博弈論在特倫頓和普林斯頓的美國獨立戰爭中的應用與指揮官們所追求的不同,展示了使用博弈論如何提供獨特的見解,這對於像康沃利斯這樣經驗豐富的將軍來說並不明顯。最後,該專著展示了軍團級別的參謀人員如何使用博弈論來理解戰略級別的決策如何影響作戰級別的行動,比較了同步博弈和序列博弈的實用性。最後一部分提供了一個基本框架,工作人員可以通過將博弈論應用於任務分析和行動開發過程來解決操作問題。

博弈論的使用不僅限於軍事決策過程。博弈論非常適合國防部和美國陸軍目前使用的現有規劃流程。規劃人員可以在聯合作戰設計過程和陸軍設計方法中使用博弈論工具。具體來說,在聯合設計期間,博弈論工具最適合理解戰略指導和理解作戰環境。在軍隊設計期間,它最適合構建作戰環境和理解問題。博弈論是參謀人員或計劃團隊的工具包中的另一個有用工具。當通過軍事決策過程或設計過程應用時,博弈論分析與其他工具很好地結合在一起,可以更好地了解作戰環境。

成為VIP會員查看完整內容
68
0

摘要

DARPA 於 2015 年製定了可解釋人工智能 (XAI) 計劃,旨在使最終用戶能夠更好地理解、信任和有效管理人工智能係統。 2017年,為期四年的XAI研究計劃開始。現在,隨著 XAI 在 2021 年結束,是時候反思什麼成功了,什麼失敗了,以及學到了什麼。本文總結了 XAI計劃的目標、組織和研究進展。

1 XAI計劃創建背景

機器學習的巨大成功創造了新的人工智能 (AI) 能力的爆炸式增長。持續的進步有望產生能夠自行感知、學習、決策和行動的自主係統。這些係統提供了巨大的好處,但它們的有效性將受到機器無法向人類用戶解釋其決策和行動的限製。這個問題對美國國防部 (DoD) 尤其重要,它麵臨著需要開發更智能、自主和可靠係統的挑戰。可解釋的人工智能對於用戶理解、適當信任和有效管理新一代人工智能合作夥伴至關重要。

可解釋性問題在某種程度上是人工智能成功的結果。在人工智能的早期,主要的推理方法是邏輯和符號。這些早期係統通過對(某種程度上)人類可讀符號執行某種形式的邏輯形式來進行推理。早期係統可以生成其推理步驟的痕跡,然後可以成為解釋的基礎。因此,在如何使這些係統可解釋方麵進行了大量工作(Shortliffe & Buchanan, 1975; Swartout, Paris, & Moore, 1991; Johnson, 1994; Lacave & D´ıez, 2002; Van Lent, Fisher, & Mancuso , 2004)。

然而,這些早期的人工智能係統是無效的;事實證明,它們的建造成本太高,而且對於現實世界的複雜性來說太脆弱了。 AI 的成功伴隨著研究人員開發了新的機器學習技術,這些技術可以使用他們自己的內部表示(例如,支持向量、隨機森林、概率模型和神經網絡)來構建世界模型。這些新模型更有效,但必然更不透明且難以解釋。

2015 年是 XAI 需求的轉折點。數據分析和機器學習剛剛經曆了十年的快速發展(Jordan & Mitchell,2015)。在 2012 年突破性的 ImageNet 演示之後,深度學習革命才剛剛開始(Krizhevsky、Sutskever 和 Hinton,2012 年)。大眾媒體對超級智能 (Bostrom, 2014) 和即將到來的 AI 啟示錄(Apocalypse) (Gibbs, 2017, Cellan-Jones, 2014, Marr, 2018) 充滿活力猜測。每個人都想知道如何理解、信任和管理這些神秘的、看似高深莫測的人工智能係統。

2015 年還出現了提供可解釋性的初步想法。一些研究人員正在探索深度學習技術,例如使用反卷積網絡來可視化卷積網絡的層級(Zeiler & Fergus,2014)。其他研究人員正在尋求學習更多可解釋模型的技術,例如貝葉斯規則列表 (Letham, Rudin, McCormick, & Madigan, 2015)。其他人正在開發與模型無關的技術,可以用機器學習模型(作為黑盒)進行試驗,以推斷出近似的、可解釋的模型,例如 LIME(Ribeiro、Singh 和 Guestrin,2016 年)。還有一些人評估可解釋交互的心理和人機交互因素(Kulesza、Burnett、Wong 和 Stumpf,2015 年)。

DARPA 花了一年時間調查研究人員,分析可能的研究策略,並製定計劃的目標和結構。 2016 年 8 月,DARPA 發布 DARPA-BAA-16-53 征集提案。

2 XAI計劃目標

可解釋人工智能 (XAI) 的既定目標是創建一套新的或改進的機器學習技術,以產生可解釋的模型,當與有效的解釋技術相結合時,使最終用戶能夠理解、適當地信任和有效地管理新一代人工智能係統。

XAI 的目標是最終用戶,他們依賴於 AI 係統產生的決策或建議,或者它采取的行動,因此需要了解係統的基本原理。例如,從大數據分析係統接收建議的情報分析師需要了解它為什麼建議某些活動,需要進行進一步調查。同樣,執行自主係統任務的操作員需要了解係統的決策模型,以便在未來的任務中適當地使用它。 XAI 的概念是為用戶提供解釋,使他們能夠了解係統的整體優勢和劣勢;傳達對其在未來/不同情況下的表現的理解;並且可能允許用戶糾正係統的錯誤。

XAI 計劃假設機器學習性能(例如,預測準確性)和可解釋性之間存在固有矛盾關係,這一問題與當時的研究結果一致。通常性能最高的方法(例如深度學習)是最難解釋的,而最可解釋的(例如決策樹)是最不準確的。該計劃希望創建一係列新的機器學習和解釋技術,為未來的從業者提供更廣泛的設計選項,涵蓋性能-可解釋性交易空間。如果應用程序需要更高的性能,XAI 產品組合將包括更可解釋、高性能的深度學習技術。如果應用係統需要更多的可解釋性,XAI 將包括性能更高、可解釋的模型。

3 XAI計劃結構體係

該計劃分為三個主要技術領域(technical areas,TAs),如圖 1 所示:(1)開發新的 XAI 機器學習和可解釋技術以產生有效的解釋性;(2)通過總結、延伸和應用可解釋心理學理論,來理解可解釋心理; (3) 在兩個挑戰問題領域評估新的 XAI 技術:數據分析和自主性。

圖1:DARPA的XAI計劃結構,包括技術領域(TAs)和評估框架

最初的計劃時間表包括兩個階段:第一階段,技術演示(18 個月);第 2 階段,比較評估(30 個月)。在第一階段,開發人員被要求針對他們自己的測試問題展示他們的技術。在第 2 階段,最初的計劃是讓開發人員針對政府評估人員定義的兩個常見問題之一(圖 2)測試他們的技術。在第 2 階段結束時,預計開發人員將向開源 XAI 工具包貢獻原型軟件。

圖2:麵臨的挑戰問題

4 XAI計劃開發

2017年5月,XAI計劃開始啟動。選擇了 11 個研究團隊來開發可解釋學習器 (TA1),並選擇了一個團隊來開發可解釋的心理模型。評估由美國海軍研究實驗室提供。以下總結了這些進展以及該計劃結束時這項工作的最終狀態。 Gunning 和 Aha,2019 年給出了 2018 年底 XAI 發展的中期總結。

4.1 XAI可解釋的學習方法(XAI Explainable Learner Approaches)

該計劃預計研究人員將調查訓練過程、模型表示,以及重要的解釋交互。為模型表示設想了三種通用方法。可解釋的模型方法將尋求開發對機器學習專家來說本質上更易於解釋和更內省的 ML 模型。深度解釋方法將利用深度學習或混合深度學習方法來產生除預測之外的解釋。最後,模型歸納技術將從更不透明的黑盒模型創建近似可解釋的模型。解釋交互被認為是 XAI 的一個關鍵元素,將用戶連接到模型,使他們能夠理解決策過程並與之交互。

隨著研究的進展,11 個 XAI 團隊探索了許多機器學習方法,例如易處理的概率模型 (Roy et al. 2021) 和因果模型 (Druce et al. 2021) 以及強化學習算法生成的狀態機等解釋技術(Koul et al. 2019, Danesh et al. 2021), 貝葉斯教學 (Yang et al. 2021), 視覺顯著圖 (Petsiuk 2021, Li et al. 2021, Ray et al. 2021, Alipour et al. 2021, Vasu et al. 2021),以及網絡和 GAN 解剖 (Ferguson et al. 2021)。也許最具挑戰性和最獨特的貢獻來自機器學習和解釋技術的結合,以進行精心設計的心理實驗來評估解釋的有效性。

隨著計劃的推進,我們也對用戶範圍和開發時間線有了更深入的了解(圖 3)。

圖3: XAI用戶和開發時間表

4.2 解釋的心理學模型(Psychological Models of Explanation)

該計劃需要對解釋有紮實的心理學理論支持。選擇了一個團隊來總結當前的解釋的心理學理論,以協助 XAI 開發人員和評估團隊。這項工作始於對解釋心理學的廣泛文獻調查以及之前關於 AI 可解釋性的工作(IHMC 文獻調查的參考資料)。最初,該團隊被要求(1)對當前的解釋理論進行總結,(2)根據這些理論開發一個解釋的計算模型; (3) 根據 XAI 開發人員的評估結果驗證計算模型。開發計算模型被證明是一座太極端的橋梁,但該團隊確實對該領域有深入的了解並成功地製作了描述性模型。這些描述性模型對於支持有效的評估方法至關重要,這些評估方法涉及精心設計的用戶研究,按照美國防部人體研究指南進行。圖4說明了 XAI 解釋過程的頂級描述模型。

圖 4:解釋心理模型。黃色框說明了基本過程。綠色方框說明了測試標準。白框說明了潛在的結果。

4.3 評估

最初設想評估基於數據分析和自主性領域內的一組常見問題。然而,很快就很清楚,在廣泛的問題領域中探索各種方法會更有價值。為了評估該計劃最後一年的表現,由美國海軍研究實驗室 (NRL) 領導的評估小組開發了一個解釋評分係統 (ESS)。基於一組領域專家的建議並使用內容有效性比 (CVR) 進行驗證,ESS 提供了一種用於評估 XAI 用戶研究設計的定量機製。 ESS 評估用戶研究的多個要素,包括任務、領域、解釋、解釋交互、用戶、假設、數據收集和分析。 XAI 評價指標如圖 5所示,包括功能性指標、學習績效指標和解釋有效性指標。仔細設計用戶研究以準確評估解釋的有效性至關重要。通常,評估 XAI 算法的性能需要多種類型的度量(參見性能、功能、解釋有效性)。 XAI 用戶研究設計可能很棘手,通常在該計劃中最有效的團隊擁有具有豐富心理學專業知識的人員。

圖5:XAI算法的評估措施

5 XAI計劃開發方法

XAI計劃探討了許多方法,如表1所示。

表1: DARPA XAI計劃的技術方法

6 XAI結果與經驗教訓

在該計劃期間進行了三項主要評估:一項在第 1 階段,兩項在第 2 階段。為了評估 XAI 技術的有效性,該計劃的研究人員設計並執行了用戶研究。用戶研究仍然是評估解釋的黃金標準。在 XAI 研究人員進行的用戶研究中,大約有 12,700 名參與者,其中包括大約 1900 名受監督的參與者,其中個人由研究團隊指導(例如親自或在 Zoom 上)和 10800 名無監督的參與者,其中個人自我通過實驗進行指導,並且沒有受到研究團隊(例如 Amazon Mechanical Turk)的積極指導。根據美國國防部 (DoD) 資助的所有人類受試者研究的政策,每個研究方案都由當地機構審查委員會 (IRB) 審查,然後國防部人類研究保護辦公室審查方案和當地 IRB 調查結果。

在這些用戶研究過程中,確定了幾個關鍵要:

  • 與隻提供決策的係統相比,用戶更喜歡為決策提供解釋的係統。解釋提供最大價值的任務是用戶需要了解 AI 係統如何做出決策的內部工作原理的任務。 [由跨執行者團隊的 11 項實驗支持]

  • 為了讓解釋提高用戶任務表現,任務必須足夠困難,使得AI 解釋會有所幫助。 [PARC, UT Dallas]

  • 用戶認知負荷會阻礙用戶解讀解釋的表現。結合上一點,需要對解釋和任務難度進行校準,以提高用戶表現。 [UCLA, Oregon State]

  • 當 AI 不正確時,解釋更有幫助,並且對邊緣情況特別有價值。 [UCLA, Rutgers]

  • 解釋有效性的衡量標準會隨著時間而改變。 [Raytheon, BBN]

  • 與單獨的解釋相比,可取性(advisability)可以顯著提高用戶的信任度。 [UC Berkeley]

  • XAI 可用於測量和調整用戶和 XAI 係統的心智模型。 [Rutgers, SRI]

  • 最後,由於 XAI 的最後一年發生在 COVID-19 大流行時期,我們的執行團隊開發了設計 Web 界麵的最佳實踐,以便在難於麵對麵研究的情況下進行 XAI 用戶研究。 [OSU, UCLA] Dikkala 2021

如前所述,學習表現和可解釋性之間似乎存在一種自然的矛盾關係。然而,在整個計劃過程中,我們發現了可解釋性可以提高性能(Kim et al. 2021, Watkins et al. 2021)。從直觀的角度來看,訓練係統以產生解釋,通過額外的損失函數、訓練數據或其他機製來提供額外的監督,以鼓勵係統學習更有效的世界表征。雖然這可能並非在所有情況下都是正確的,並且在可解釋的技術何時將具有更高性能時仍有大量工作要做,但它提供了希望,未來的 XAI 係統可以在滿足用戶解釋需求的同時比當前係統具有更高的性能。

7 2021 年 DARPA 計劃之後的世界狀況、AI和 XAI

XAI 目前沒有通用的解決方案。如前所述,不同的用戶類型需要不同類型的解釋。這與我們與其他人互動時所麵臨的沒有什麼不同。例如,考慮一名醫生需要向其他醫生、患者或醫學審查委員會解釋診斷。或許未來的 XAI 係統將能夠自動校準並向大量用戶類型中的特定用戶傳達解釋,但這仍然遠遠超出了當前的技術水平。

開發 XAI 的挑戰之一是衡量解釋的有效性。 DARPA 的 XAI 計劃幫助開發了該領域的基礎技術,但還需要做更多的工作,包括從人為因素和心理學界中汲取更多信息。需要開發者社區很好地建立、易理解和易實施的解釋有效性衡量標準,才能使有效的解釋成為 ML 係統的核心能力。

加州大學伯克利分校的結果 (Kim et al. 2021) 證明了可取性(AI 係統從用戶那裏獲取建議的能力)提高了用戶的信任度,這很有趣。當然,用戶可能更喜歡可以快速糾正係統行為的係統,就像人類可以相互提供反饋一樣。這種可以產生和消費解釋的可取的人工智能係統將是實現人類和人工智能係統之間更緊密合作的關鍵。

為了有效地開發 XAI 技術,需要跨多個學科的密切合作,包括計算機科學、機器學習、人工智能、人為因素和心理學等。這可能特別具有挑戰性,因為研究人員傾向於專注於單個領域,並且經常需要推動跨領域工作。也許將來會在多個當前學科的交叉點上創建一個特定於 XAI 的研究學科。為此,我們致力於創建一個可解釋的 AI 工具包 (XAITK),它將各種程序工件(例如代碼、論文、報告等)和從 DARPA 為期四年的 XAI 計劃中吸取的經驗收集到一個公開的可訪問的位置(Hu et al. 2021,網址https://xaitk.org/ )。我們相信,在操作環境中部署 AI 功能並需要在廣泛的現實條件和應用領域中驗證、表征和信任 AI 性能的任何人都會對該工具包產生廣泛的興趣。

與 2015 年相比,今天我們對 AI 的理解更加細致入微、不那麼戲劇化,或許也更加準確。我們當然對深度學習的可能性和局限性有了更準確的理解。人工智能的末日已經從迫在眉睫的危險變成了遙遠的好奇。同樣,XAI 計劃對 XAI 產生了更細致入微、不那麼戲劇化、或許更準確的理解。該計劃無疑起到了促進 XAI 研究(包括計劃內部和外部)的作用。結果對 XAI 的使用和用戶、XAI 的心理、衡量解釋有效性的挑戰以及產生新的 XAI ML 和 HCI 技術組合有了更細致的理解。當然還有更多工作要做,特別是隨著新的人工智能技術的開發,這些技術將繼續需要解釋。 XAI 將在一段時間內繼續作為一個活躍的研究領域。作者認為,XAI 計劃通過為開展這項工作奠定了基礎,做出了重大貢獻。

成為VIP會員查看完整內容
69
0

【導讀】大數據的爆發式增長,催生了對高維數據分析的需求。圍繞高維機器學習,有三部經典書籍包括加州大學歐文分校Roman Vershynin教授的《高維概率論》、伯克利Martin Wainwright教授《高維統計學》、哥倫比亞大學John Wright教授與伯克利馬毅教授《高維數據分析》,非常值得收藏!

高維概率論

《高維概率》提供了對隨機向量、隨機矩陣、隨機子空間和用於量化高維不確定性的對象的行為的洞察。借鑒了概率、分析和幾何的思想,它適用於數學、統計學、理論計算機科學、信號處理、優化等領域。它是第一個將高維概率的理論、關鍵工具和現代應用集成起來的。集中不等式是其核心,它涵蓋了Hoeffding和Chernoff等經典不等式和Bernstein等現代發展。然後介紹了基於隨機過程的強大方法,包括Slepian的、Sudakov的和Dudley的不等式,以及基於VC維的泛鏈和界。整本書包含了大量的插圖,包括經典和現代的協方差估計、聚類、網絡、半定規劃、編碼、降維、矩陣補全、機器學習、壓縮感知和稀疏回歸等結果。

這是一本教科書在高維概率與數據科學的應用展望。它是為博士和高級碩士學生和數學,統計,電子工程,計算機科學,計算生物學和相關領域的初級研究人員,誰正在尋求擴大他們的理論方法在現代研究數據科學的知識。

https://www.cambridge.org/gb/academic/subjects/statistics-probability/probability-theory-and-stochastic-processes/high-dimensional-probability-introduction-applications-data-science?format=HB#8FyVeUCeT4PcEjMp.97

高維統計學

近年來,在所有科學學科和工業環境中收集的數據的數量和種類都出現了爆炸式增長。如此龐大的數據集給統計學和機器學習領域的研究人員帶來了許多挑戰。這本書提供了高維統計領域的一個獨立的介紹,旨在第一年的研究生水平。它包括章節集中在核心方法和理論-包括尾界,集中不等式,統一定律和經驗過程,和隨機矩陣-以及章節致力於深入探索特定的模型類-包括稀疏線性模型,矩陣模型與秩約束,圖形模型,以及各種各樣的非參數模型。與數以百計的工作示例和練習,這篇文章旨在為課程和自學的研究生和研究人員在統計,機器學習,和相關領域,進行理解,應用,並適應適合大規模數據的現代統計方法。

低維模型進行高維數據分析:原理、計算和應用

地址:

https://book-wright-ma.github.io/

本書涵蓋了用於高維數據分析的新的數學原理(統計和幾何)、可擴展(凸和非凸)優化方法,以及重要的應用,如科學成像、寬帶通信、人臉識別、3D視覺和深度網絡。這本書將被用作數據科學、信號處理、優化和機器學習領域的研究生入門教科書。它已被用於課程EECS 290(伯克利)和ELEN 6886(哥倫比亞)。 在過去的二十年裏,高維空間中低維結構的研究有了巨大的發展。在很大程度上,具有代表性的低維模型(如稀疏和低秩以及它們的變體和擴展)的幾何和統計特性現在已經很好地理解了。在何種條件下,這些模型可以有效地和高效地從(最小采樣量)數據中恢複,已經清楚地描述了。為了從高維數據中恢複低維模型,已經開發了許多高效和可擴展的算法。對這些算法的工作條件和計算複雜性也進行了詳細的描述。這些新理論結果和算法已經徹底改變了科學和信號處理的實踐數據, 並對傳感、成像和信息處理產生了重要的影響。在科學成像、圖像處理、計算機視覺、生物信息學、信息檢索和機器學習等領域,我們已取得了顯著的技術進步。正如我們將從本書中介紹的應用程序中看到的,其中一些發展似乎違背了傳統智慧。 見證了這一曆史性的進步,我們認為,現在是全麵研究這一新知識體係並在統一的理論和計算框架下組織這些豐富成果的時候了。關於壓縮感知和稀疏模型的數學原理,已有許多優秀的書籍。然而,本書的目標是通過真正有效的計算,彌合低維模型在高維數據分析中的原理和應用之間的差距: 本書結構

這本書的主體包括三個相互關聯的部分: 原理、計算和應用(PCA)。本書還對相關的背景知識做了附錄。

第一部分: 原理(2-7章)提出了稀疏、低秩和一般低維模型的基本性質和理論結果。它描述了在保證正確性或精度的情況下,恢複這種低維結構的逆問題變得易於處理並且能夠有效地解決的條件。

第二部分: 計算(第8章和第9章)介紹了凸和非凸優化的方法,以開發用於恢複低維模型的實用算法。這些方法展示了如何係統地提高算法效率和降低整體計算複雜度,從而使生成的算法快速、可擴展到大尺寸和高維數據的強大思想。

第三部分: 應用(10到16章)演示了如何前麵兩部分的原理和計算方法可能價格不能提高解決各種現實問題和實踐。這些應用還指導如何適當地定製和擴展本書中介紹的理想化的模型和算法,以包含關於應用的其他領域特定知識(先驗或約束)。

最後的附錄(A-E)在書的最後是為了使這本書很大程度上是獨立的。

成為VIP會員查看完整內容
60
0

【主要講師】

Karl Tuyls 教授是一名利物浦大學人工智能研究員和計算機科學教授,DeepMind(巴黎)的科學家。興趣主要集中在理解智能並利用這些知識在多智能體環境中構建人工智能。其研究圍繞著開發用於評估和訓練智能體的博弈論技術,以及開發動態博弈論作為在合作和競爭多智能體環境中學習的基礎。與此相關的是,還研究多機器人係統。

【教程slides】

成為VIP會員查看完整內容
60
0

時間序列(time series)是一組按照時間發生先後順序進行排列的離散序列,是日常生活中最常見的數據形式之一。對時間序列的分析是既是統計學中的重要問題,也是人工智能、數據挖掘的一個重要應用方向。

本課程麵向人工智能學院的本科生和研究生,重點關注統計學中分析時間序列的基本思路、模型以及方法。同時強調使用人工智能技術對時序數據這一種特殊的數據類型進行分析,也關注使用“時間序列分析”中的思路看待和解決人工智能領域的實際問題。

課程內容將從時間序列的發展曆程、平穩性、經典分析模型等概念先後推進。課程中也會介紹人工智能的相關技術,如使用循環神經網絡進行時間序列的建模,或使用時間序列中的自回歸、指數平均思想建模機器學習、計算機視覺的重要問題。

https://www.lamda.nju.edu.cn/yehj/timeseries2021/?AspxAutoDetectCookieSupport=1

目錄內容: * 課程介紹,導論,回歸模型 * 時間序列的隨機過程視角 * 基於隨機過程視角的經典模型 * 針對非平穩時間序列的經典模型 * 假設擴展 * 維度擴展 * 建模方式擴展

成為VIP會員查看完整內容
59
0

【導讀】李飛飛老師的CS231N課程《卷積神經網絡視覺識別》被奉為經典,最新2021季3月30號開始了!眾多想學習深度卷積神經網絡的同學,可不能錯過!

地址

http://cs231n.stanford.edu/index.html

計算機視覺已經在我們的社會中變得無處不在,應用在搜索、圖像理解、應用程序、地圖、醫學、無人機和自動駕駛汽車。這些應用的核心是視覺識別任務,如圖像分類、定位和檢測。神經網絡(又稱“深度學習”)方法的最新發展極大地提高了這些最先進的視覺識別係統的性能。本課程將深入研究深度學習架構的細節,重點是學習這些任務的端到端模型,特別是圖像分類。在10周的課程中,學生將學習實施和訓練自己的神經網絡,並對計算機視覺的前沿研究有詳細的了解。此外,最後的作業將給他們機會訓練和運用數百萬參數網絡的現實世界的視覺問題,他們的選擇。通過多個實踐作業和期末課程項目,學生將獲得設置深度學習任務的工具集,以及訓練和微調深度神經網絡的實際工程技巧。

成為VIP會員查看完整內容
68
0

分析時間導向的數據和預測時間序列的未來價值是分析師在許多領域麵臨的最重要的問題之一,從金融和經濟到生產運營管理,到政治和社會政策會議的分析,調查人類對環境的影響以及他們對環境做出的決策。因此,在金融、經濟、科學、工程、統計和公共政策等各個領域,有一大批人需要了解時間序列分析和預測的一些基本概念。不幸的是,大多數基本的統計和運營管理書籍很少(如果有的話)關注麵向時間的數據,也很少提供預測方麵的指導。有一些關於時間序列分析的高級書籍。這些書大多是為正在攻讀博士學位或在該領域做研究的技術專家而寫的。他們往往是非常理論化的,經常關注一些特定的主題或技術。我們寫這本書就是為了填補這兩個極端之間的空白。

成為VIP會員查看完整內容
51
0

  • 人工智能含義及發展
  • 中國人工智能產業發展進程
  • 中國人工智能投融資規模
  • AI芯片市場規模和預測
  • 人工智能+金融:應用現狀
  • 中國人工智能產業發展趨勢
成為VIP會員查看完整內容
53
1

使用Python和PySpark進行數據分析可以幫助您解決使用PySpark進行數據科學的日常挑戰。您將了解如何在從任何源(Hadoop集群、雲數據存儲或本地數據文件)獲取數據的同時,在多台機器上擴展處理能力。一旦您了解了這些基礎知識,您將通過構建機器學習管道,並混合Python、pandas和PySpark代碼來探索PySpark的全麵通用性。

成為VIP會員查看完整內容
49
0

工業人工智能 (AI) 是人工智能在工業中的應用,是第四次工業革命中價值創造的主要貢獻者。人工智能正被嵌入到廣泛的應用程序中,幫助組織獲得顯著的利益,並使他們能夠改變向市場提供價值的方式。

本文檔為支持人工智能的工業物聯網係統的開發、培訓、文檔編製、通信、集成、部署和操作提供指導和幫助。它麵向來自 IT 和運營技術 (OT)、來自多個學科的業務和技術的決策者,包括業務決策者、產品經理、係統工程師、用例設計師、係統架構師、組件架構師、開發人員、集成商和係統操作員。

該文檔圍繞 IIC 工業互聯網參考架構中的架構觀點構建,即業務、使用、功能和實施觀點。該文件討論了推動人工智能采用的商業和價值創造考慮因素。它還詳細闡述了人工智能的使用、工業用例以及與之相關的道德、隱私、偏見、安全、勞工影響和社會問題。在技術方麵,該文檔描述了與 AI 相關的架構、功能和數據注意事項,並討論了各種實施注意事項,例如性能、可靠性、數據屬性和安全性​。

人工智能的采用將在行業中加速。鑒於計算能力的快速增長、可用於訓練的數據的更廣泛可用性以及算法的日益複雜,人工智能技術將繼續發展。當前的 IT 標準和最佳實踐必須不斷發展,以解決 AI 本身的獨特特征以及與 IIoT 係統的安全性、可靠性和彈性相關的具體考慮因素。此外,人工智能技術的日益成熟將幫助人們認識到它的好處遠遠超過它的風險。 AI 標準生態係統也將繼續發展,例如 ISO/IEC JTC 1/SC42 正在進行的標準工作,為 JTC 1、IEC 和 ISO 委員會製定 AI 標準提供指導。

基於這些趨勢,毫無疑問,人工智能將繼續推動技術和功能上的可能性,因此預期合理的事情將同樣發展。對技術的態度和對其使用的商業期望也將繼續發展。

未來,我們可以期待使用人工智能技術成為常態,而不是例外,考慮到這項技術的社會效益,“不使用人工智能”最終可能會成為不負責任的做法。

成為VIP會員查看完整內容
49
0

【作 者】

Edwin Ho 1, Arvind Rajagopalan 2, Alex Skvortsov 3, Sanjeev Arulampalam 3, Mahendra Piraveenan 1*

1 悉尼大學工程學院

2 澳大利亞國防科技 (DST) 集團武器和作戰係統部

3 澳大利亞國防科技 (DST) 集團海事部

【摘 要】

本文簡要回顧了使用博弈論對與國防應用相關的決策場景進行建模的文獻。博弈論已被證明是對智能體、實體和玩家的決策過程進行建模的非常有效的工具。它已被用於對經濟學、進化生物學和計算機科學等不同領域的場景進行建模。在防禦應用中,通常需要建模和預測敵方的行為,以及試圖逃避或智取對方的玩家的行為。模擬競爭者的行為如何影響彼此的決策是博弈論的強項。在過去的幾十年裏,有幾項研究應用博弈論的不同分支來模擬一係列與防禦相關的場景。本文對此類嚐試進行了結構化回顧,並根據所建模的戰爭類型、所使用的博弈類型以及所涉及的參與者,對現有文獻進行了分類。經過精心挑選,共有29篇直接相關的論文進行討論和分類。就戰爭建模而言,我們認識到大多數將博弈論應用於國防環境的論文都與指揮和控製戰有關,並且可以進一步分為處理 (i) 資源分配戰 (ii) 信息戰 (iii)武器控製戰,以及 (iv) 對手監控戰。我們還觀察到,大多數綜述論文都涉及傳感、跟蹤和大型傳感器網絡,並且研究的問題與民用領域的傳感器網絡分析有相似之處。在使用的博弈方麵,我們將審查過的論文分為使用非合作或合作博弈、同時或順序博弈、離散或連續博弈以及非零和或零和博弈的論文。類似地,論文也分為基於兩人、三人或多人博弈的論文。我們還探討了參與者的性質和每個場景中收益函數的構建。最後,我們還確定了文獻中的空白,在這些空白中,博弈論可以有效地應用於迄今為止尚未使用博弈論探索過的場景。所提出的分析提供了關於在國防應用中使用博弈論的最新技術的簡明總結,並強調了博弈論在所考慮的場景中的好處和局限性。

關鍵詞: 決策;博弈論;國防科學;地麵戰;海戰;空戰;跟蹤;傳感

1. 引 言

博弈論已成為傳統的理論框架之一,用於模擬我們生活中許多方麵的重要決策過程。眾所周知的例子可以在經濟學、社會科學、金融、項目管理、計算機科學、公民學和流行病學中找到(參見 [1,2,3,4,5] 和其中的參考文獻)。由於約翰·馮·諾伊曼、約翰·納什和其他人的開創性工作 [6,7,8],眾所周知,在兩方或多方(玩家)之間的複雜互動(博弈)的背景下,存在一種最佳策略,可以導致可預測的結果(回報)。在實際情況下,該結果通常可以是定量的並且可以通過算術運算(成本、感染人數、接種疫苗的人數等),但通常可以是定性的(例如風險、準備水平、健康狀況等)。

博弈論和相關數學方法的應用最近在國防領域引起了越來越多的關注。這是由於兩個驅動因素。首先,博弈論提供了一個自然框架,可以將高層政策決策迅速轉化為最優戰略,將其量化為收益、成本、收益或損失、風險等。這為國防決策者創造了一個統一的平台支持達成特定決定。其次,它為根據預定義標準評估和優化眾多場景提供了嚴格的數學框架。這種及時的評估往往成為國防作戰環境中的關鍵成功因素,從而在時間壓力下獲得決策優勢。

博弈論在國防領域的應用有著持續和多樣化的曆史,從實時軍事係統的設計(例如,應用於導彈攔截)到支持大型國防投資和采購的戰略決策。關於具體的理論方法和工具及其防禦應用有大量文獻。我們相信,對這些文獻的回顧對於處理運營分析和數據驅動決策支持的社區來說是有意義的。這是本研究的主要動機。

博弈論 [9,10] 通過對局勢的整體和定量分析 [11] 增強了軍事戰略和決策過程。對於軍方來說,博弈論分析的潛在場景包括自主智能係統的快速增長應用,博弈論提供了一個全麵的數學框架,大大提高了使用這些係統的人的決策能力。由於其潛力,對博弈論的研究正在蓬勃發展,不少論文開始出現在這一軍事研究領域的文獻中。鑒於此類研究仍處於起步階段,本綜述旨在幫助研究人員利用博弈論中的知識體係為國防從業者開發更智能、更安全的決策係統。

要了解博弈論在國防領域的應用領域的最新技術,並分析在這種情況下使用的博弈類型,需要進行回顧。據我們所知,這種跨越博弈論在各種軍事領域的不同應用的評論是缺乏的。本文的目的是提出這樣的評論,以便更好地理解博弈論可以成功應用的眾多防禦問題。此外,在不同背景下使用的博弈類型的多維分類將為研究人員提供在相關問題中應用博弈論的新方法的見解。最後,我們提出了文獻中的空白,我們希望這些空白會引起對防禦問題的新穎博弈論方法的更多研究和開發。

雖然並不過分廣泛,但圍繞軍事博弈論的文獻已經涵蓋了不同形式的交戰和戰鬥的顯著部分。這些論文涵蓋了過去、現在和未來的情景:從潛在敵對局勢中的預測策略到數千年前軍事僵局的事後分析評估。博弈論已經證明了在任何此類軍事場景中都有用的能力。然而,快速的技術進步導致了軍事交戰不斷出現的新領域,每一個領域都擁有自己的複雜係統。已經解決的首要領域是跟蹤係統(跨所有領域)、空中作戰、地麵作戰、國家安全問題、網絡戰和太空係統。值得注意的是,博弈論在海戰中的應用很少,對此類領域未來研究的探索將在後麵的評論中討論。在這些領域中的每一個領域中,都有無數的新係統和創新係統的可能性:不同的代理、不同的武器、不同的控製結構——每一個都可以通過博弈論分析得到豐富。雖然 Haywood 和 Thunholm 的關於軍事決策中使用的博弈論的論文涵蓋了幾種不同的博弈類型 [12,13],但似乎沒有一篇論文討論博弈論在軍事決策中的應用。基於高性能計算和複雜算法的軍事係統新背景下的領域。我們的目標是以這樣一種方式呈現文獻,它解決了每個關鍵領域的軍事控製係統中博弈論的所有功能。 本次綜述經過精心挑選,共詳細考慮了29篇論文。它強調了每篇分析論文的範圍和效用,通過基本博弈論概念來呈現:參與者、博弈類型、策略及其收益函數的關鍵參數。它將作為一個帶注釋的參考書目以及一個框架來理解和計劃對該領域的進一步研究。它還將列出玩家在每個軍事決策場景中考慮的基本原則,以及它們如何影響軍事人員和係統做出的決策,無論是與敵對玩家競爭還是與友好玩家合作.這將使大多數軍事場景可以被視為博弈,並且至少可以為熟悉的軍事情況提供一個有趣的新視角。這裏綜述的 29 篇論文是從 Scopus 和 Google Scholar 中選出的,由一個具有國防、學術界和工業界相關背景的專家團隊可以提供不同的觀點,他們根據不同的經驗確定了最相關的論文。隻考慮用英語寫的論文。雖然我們承認沒有進行詳盡的搜索,但據我們所知,這些論文涵蓋了我們在這裏討論的研究領域的一個重要和具有代表性的部分,並充分展示了這一領域的文獻的趨勢、重疊和空白。因此,可以肯定的是,所提出的分析將對論文進行嚴格的比較,並突出每一篇論文的優缺點,同時也突出利用博弈論為軍事環境下的決策建模的總體利弊。

本文的其餘部分的結構如下。第 2 節將討論我們審查的論文中闡述的基本防禦原則,並介紹博弈論的基本概念。第 3 節調查和分析文獻並總結每篇論文中的發現和關聯。第 4 節根據上一節中的觀察詳細闡述了我們對文獻的多維分類,並介紹了與所審查論文相關的引用和其他指標。第 5 節確定了文獻中的空白,並在此基礎上強調了該領域未來研究的機會,特別是可以從博弈論應用中受益的國防研究領域,而博弈論迄今尚未經常應用。第 6 節深入討論了研究結果的效用和所提出的綜述。最後,第 7 節總結了我們的發現和分類,並提供了廣泛的結論。

2. 背 景

幾個世紀以來,關於戰爭的意識形態、信仰和知識一直在塑造人類的知識和哲學。孫子、荷馬和馬基雅維利 [14,15,16] 的偉大著作不僅為刻在軍事決策本質中的知識奠定了基礎,而且為社會學和社會心理學提供了洞察力 [17]。軍隊構成了許多文明的核心權力集團,有助於現有國家影響力的增長和新國家的誕生[18]。軍方實時處理衝突、未來計劃以及回顧過去的交戰——這些活動中的每一項都會對社會產生影響 [19]。因此,本次審查必然涉及跨多個物理領域的軍事衝突的許多方麵,需要在每個領域做出的主要決策將總結如下。然而,在所有這些領域中,目標的價值、資源的價值和目標的優先級通常是塑造回報函數和策略的關鍵參數,而回報函數和策略反過來又定義了我們在建模中使用的博弈。

在本節中,我們將討論國防科學和技術中的概念以及博弈論,這些概念對於理解和分析所介紹的利基中的文獻是必要的。首先,讓我們考慮一下本次審查中考慮的國防和國家安全的廣泛領域。可以對它們進行總結,如表 1 所示。

表 1. 本次綜述中使用的分類係統

如表 1所示,在本次審查中,重點主要放在“指揮與控製”戰爭上,其中決策至關重要。然而,指揮與控製戰既適用於陸、海、空戰等傳統戰爭領域,也適用於太空和網絡戰等現代戰爭領域。在正交層麵上,指揮與控製戰還可以細分為資源分配戰(RAW)、信息戰(IW)、武器控製戰(WCW)以及對手監控戰(AMW)。由於這些概念在我們的文獻分類中被廣泛使用,讓我們先簡單介紹一下。

2.1 戰爭類型

資源分配戰(RAW):為實現軍事目標而進行的軍事資源分配。 信息戰(IW):操縱信息以實現軍事目標。 武器控製戰(WCW):控製武器以實現軍事目標。 對手監控戰(AMW):跟蹤敵人的行為以實現軍事目標。

2.2 戰爭領域

2.2.1 陸戰

技術是戰爭的主導力量,技術對於陸戰來說並不像其他領域那樣重要 [20]。影響陸戰的技術一直是相對靜止的,盡可能避免暴露人力資源 [21, 22]。如今,身體層麵的人際戰鬥已經不那麼普遍了,這讓我們更加關注定位策略。將博弈論應用於地麵戰的文獻包括強大的武器目標分配論文庫(涉及現代背景下的武器控製戰和資源分配戰),以及涉及古代地麵交戰和遊擊戰的論文。在人類生命脆弱的地方,他們的保護是這些博弈中最重要的元素,而下一個優先事項是保護地麵資產。

2.2.2 海戰

鑒於海軍在全球範圍內投射力量的重要性,無論是否應用博弈論,關於海戰的公開文獻都令人驚訝地缺乏。在處理目標跟蹤的論文中經常提到海戰,但對軍事海軍戰略的討論僅限於過時的文獻或對基本要素的討論 [23,24]。我們將回顧這方麵的可用論文,並強調這是一個文獻中存在相當大差距的領域。

2.2.3 空戰

萊特兄弟發明飛機後不久,空戰就成為戰鬥和軍事行動中的關鍵因素 [25]。在很少受到障礙物或維度阻礙的戰鬥媒介中,空戰的本質是快節奏、直觀且極其危險的,具有不可預測的交戰“規則” [26,27]。今天,與一個世紀前相比,要考慮的因素要複雜得多,而且軍隊進行空戰的資源並不短缺——人力和機器[28,29,30]。文獻表明,由於武器庫的豐富,目標和用於交戰的資源的內在和潛在價值在空戰場景中尤為重要。在評估戰鬥策略時,需要就衝突雙方的這些價值觀做出決定。因此,有幾篇論文涉及博弈論在空戰中的應用。

2.2.4 網絡戰

網絡安全是保護 IT 係統和網絡免受損壞/中斷/信息盜竊。網絡戰涉及故意攻擊信息和通信係統以獲得軍事優勢的概念。雖然網絡安全幾十年來一直是計算機科學的一個重要領域,但關於網絡戰的文獻卻更加稀缺,而且無論如何,與博弈論在計算機科學中與網絡安全相關領域的應用有很大的重疊。本綜述介紹並分析了一些專門與網絡戰有關的論文。

2.2.5 太空戰

雖然太空戰爭的概念已經存在了近一個世紀,但無論是物理執行還是太空戰爭的理論策略體係都尚未建立 [31]。然而,這並沒有阻止軍隊追逐太空[32,33],並且不可避免地導致博弈論的概念被用於太空戰戰略思維。目前這主要限於衛星網絡,其中博弈的關鍵參數是優化的電力使用和整個網絡的信號強度。這個領域還很年輕,太空軍事的進一步發展似乎是不可避免的,因此有關博弈論在太空戰爭中應用的相應文獻也將增加。

2.2.6 混合/其他戰爭

有幾篇論文討論了博弈論防禦應用的特定領域,但不能歸類為分析某種戰爭類型的論文。在其中一些論文中,重點更多地放在所使用的技術上:例如,目標跟蹤。在其他情況下,需要進行防禦的敵對行為者的性質發生了變化:例如,針對國內恐怖主義威脅而不是敵對軍事力量的國家安全行動。有幾篇論文涉及在這種情況下使用博弈論。

目標跟蹤係統:軍事目標跟蹤是對移動目標的觀察以及對其位置和機動的監視[34,35,36 ]。該領域的成功取決於觀察到的指標和數據的準確性,以及所有收集到的信息的有效分發和處理 [37]。隨著智能目標的出現,軍方還必須采用預測方法來保持理想的跟蹤性能。在這方麵審查的文獻涵蓋了從跟蹤打擊導彈到戰區彈道導彈和跟蹤未知智能代理到敵機的主題。影響博弈玩法的這一領域的關鍵考慮因素包括目標是否“聰明”/是否可以采取規避行動,目標是否具有最佳軌跡,以及目標是否有防禦者 [38]。博弈論的目標跟蹤應用主要發生在空戰和海戰中,包括水下監視。

國家安全應用:博弈論經常應用於國家安全和反恐相關領域。這包括預測和準備恐怖襲擊,以及用於保護關鍵人員和地標/其他恐怖活動潛在目標的資源分配方案。雖然潛在目標的價值和攻擊的可能性顯然是控製該領域博弈收益函數的關鍵參數,但隨後的社會、經濟和政治影響對於該領域的博弈建模同樣重要 [39,40]。很少有軍事衝突能像國內戰線那樣暴露在外 [41],以及恐怖襲擊的後果及其對公眾情緒和對安全機構的信心的影響,通常在該領域的收益函數建模中被考慮在內。

2.3 博弈論

博弈論是對戰略決策的研究,最初是作為微觀經濟學的一個分支發展起來的 [6,10,42,43]。然而,後來它被應用於不同的研究領域,如進化生物學、社會學、心理學、政治學、項目管理、財務管理和計算機科學 [1,2,5,9,11,44]。由於不同學科的戰略決策場景普遍存在,博弈論已經獲得了如此廣泛的適用性。博弈論提供了對特殊行為互動的洞察,例如動物群體內的合作互動 [45]、婚姻中的討價還價和交換 [46] 或蘇格蘭鮭魚養殖者的激勵 [47]。一個博弈通常由兩個或多個玩家組成,一組可供這些玩家使用的策略,以及每個玩家的一組相應的收益值(也稱為效用值)(在這種情況下通常表示為收益矩陣兩人博弈) [44,48]。

2.3.1 純策略與混合策略

博弈中的純策略提供了玩家如何玩博弈的完整定義。玩家的策略集是該玩家可用的純策略集 [10]。

混合策略是純策略的組合,其中特定概率 p(其中 0≤p≤1)與這些純策略中的每一個相關聯。由於概率是連續的,因此玩家可以使用無限多的混合策略。完全混合策略是一種混合策略,其中玩家為每個純策略分配嚴格的正概率。因此,任何純策略實際上都是混合策略的退化情況,其中以概率 1 選擇特定策略,以概率 0 選擇其他所有策略。

2.3.2 納什均衡

納什均衡的概念是博弈論的基礎。它是戰略博弈中的一種狀態(一組策略),就收益而言,沒有參與者有動機單方麵偏離。可以定義純策略和混合策略納什均衡。一個戰略博弈通常可以有多個納什均衡[7]。每個玩家可以從有限多個純策略中進行選擇的每個玩家數量有限的博弈在混合策略中至少有一個納什均衡,這已被證明 [7]。

納什均衡的正式定義如下。讓 ( S, f ) 是一個有 n 個玩家的博弈,其中 Si 是給定玩家 i 的策略集。因此,由所有參與者的策略集組成的策略配置文件 S 將是,S=S1 × S2 × S3… × Sn。令 f(x)=(f1(x),…,fn(x)) 為策略集 x∈S 的支付函數。假設 xi 是參與者 i 的策略,x−i 是除參與者 i 之外的所有參與者的策略集。因此,當每個玩家 i∈1,…,n 選擇策略 xi 時,策略集 x=(x1,…,xn),給特定玩家的收益 fi(x),這取決於該玩家選擇的策略 (xi) 和其他玩家選擇的策略 (xi-i)。如果任何單個參與者的策略單方麵偏差都不會為該特定參與者帶來更高的效用,則策略集 x∗∈S 處於納什均衡[10]。正式地說,x∗ 處於納什均衡當且僅當:

2.3.3 非合作博弈和合作博弈

通常,博弈被認為是為了玩家的自身利益而進行的,即使玩家合作,那也是因為在他們看來,在最大化玩家個人收益的情況下,合作似乎是最佳策略。在這樣的博弈中,合作行為(如果出現)是由自私的目標驅動的,並且是短暫的。這些博弈可以稱為“非合作博弈”。這些有時被稱為“競技博弈”,相當不準確。非合作博弈論是分析此類博弈的博弈論分支。另一方麵,在合作博弈(有時也稱為聯盟博弈)中,玩家形成聯盟或群體,有時是由於合作行為的外部強製執行,如果出現競爭,則在這些聯盟之間發生競爭 [7,8, 9]。合作博弈使用合作博弈論進行分析,該理論預測將形成哪些聯盟以及這些聯盟的收益。合作博弈論側重於聯盟之間的盈餘或利潤分享[49],其中聯盟通過形成聯盟而得到一定的回報。通常,在係統中進行的合作博弈的結果等同於受限優化過程的結果 [50]。

2.3.4 零和博弈

零和博弈是一類所有參與者的收益總和為零的競爭博弈。在兩人博弈中,這意味著一個玩家在收益中的損失等於另一個玩家在收益中的收益。因此,兩人零和博弈可以用一個隻顯示一個玩家的收益的收益矩陣來表示。零和博弈可以用 mini-max 定理來解決 [51],它指出在零和博弈中,有一組策略可以最小化每個玩家的最大損失(或最大化最小收益)。這種解決方案有時被稱為“純鞍點”。可以說股市是一場零和博弈。相比之下,大多數有效的經濟交易都是非零和的,因為每一方都認為,它收到的東西(對自己)比它分享的東西更有價值[10]。

2.3.5 完美與不完美的信息博弈

在一個完美的信息博弈中,每個玩家都知道所有其他玩家之前行為的完整曆史,以及博弈的初始狀態。在不完全信息博弈中,部分或所有玩家無法獲得關於其他玩家先前行為的全部信息 [52,53]。

2.3.6 同步博弈和序貫博弈

同步博弈要麼是正常形式的博弈,要麼是擴展形式的博弈,在每次迭代中,所有玩家同時做出決策。因此,每個玩家都被迫在不知道其他玩家(在該迭代中)做出的決定的情況下做出決定。相反,順序博弈是一種廣泛形式的博弈,其中玩家以某種預定義的順序做出決定(或選擇他們的策略) [52,53]。例如,如果一方總是有權提出第一個要約,而另一方在此之後提出要約或還價,則可以將談判過程建模為順序博弈。在順序博弈中,至少有一些玩家可以在做出自己的決定之前觀察到其他玩家的至少一些動作(否則,即使玩家的動作在時間上沒有同時發生,博弈也會變成同時博弈)。然而,對於給定的玩家來說,前一個玩家的每一個動作並不是必須要觀察到的。如果一個玩家可以觀察到每個前一個玩家的一舉一動,那麼這種順序博弈就具有“完美信息”。否則,已知博弈具有“不完美信息”[10]。

2.3.7 差異博弈

微分博弈通常是廣泛形式的博弈,但它們不是具有離散的決策點,而是在連續的時間範圍內建模 [10]。在這樣的博弈中,每個狀態變量根據微分方程隨時間連續演化。此類博弈非常適合模擬快速發展的防禦場景,其中每個玩家都參與了某些參數的自私優化。例如,在導彈跟蹤問題中,追擊者和目標都試圖控製它們之間的距離,而追擊者不斷地試圖縮小這個距離,而目標不斷地試圖增加它。在這種情況下,決策的迭代輪次過於離散,無法對每個玩家的連續運動和計算進行建模。微分博弈是模擬此類場景的理想選擇。

2.3.8 共同興趣博弈

共同興趣博弈是另一類非合作博弈,其中有一個所有玩家都嚴格比所有其他配置文件更喜歡的動作配置文件[52]。換句話說,在共同利益博弈中,玩家的利益是完全一致的。可以說,共同利益博弈是零和博弈的對立麵,在這種博弈中,玩家的利益是完全對立的,因此一個玩家的財富增加必然導致其他玩家的財富集體減少。共同利益博弈最初是在冷戰政治的背景下研究的,以理解和規定處理國際關係的策略[54]。因此,將非合作博弈分為共同利益博弈和非共同利益博弈是有意義的,就像將它們分為零和博弈和非零和博弈一樣有意義,因為這兩個概念(零和博弈和共同利益博弈)代表了非合作博弈的極端情況。

2.3.9 信號博弈

信號博弈 [52] 是一種不完全信息博弈,其中一個玩家擁有完美信息,而另一個則沒有。擁有完全信息的玩家(Sender S)通過信號將消息傳遞給其他玩家(Receiver R),其他玩家在推斷出隱藏在消息中的信息後會根據這些信號采取行動。發送者S有幾種可能的類型,其中博弈中的確切類型t對接收者R來說是未知的。t決定了S的收益。R隻有一種類型,並且兩個玩家都知道該收益。

博弈分為發送階段和表演階段。S 將發送 M={m1,m2,m3,…,mj} 消息之一。R 將接收該消息並以集合 A={a1,a2,a3,…,ak} 中的操作進行響應。每個玩家收到的收益取決於發送者的類型和消息的組合,以及接收者響應的操作。信號博弈的一個例子是 Beer-Quiche 博弈 [52],在該博弈中,接收者 B 選擇是否與玩家 A 決鬥。玩家 A 要麼乖巧要麼懦弱,而玩家 B 隻想與後者。玩家 A 選擇早餐吃啤酒或乳蛋餅。雖然他們更喜歡乳蛋餅,但乳蛋餅從刻板印象中發出信息,即吃乳蛋餅的人很懦弱。玩家B 必須根據玩家 A 選擇的早餐,分析每個決定(決鬥或不決鬥)如何給他們帶來更好的回報。

2.3.10 行為博弈論

行為博弈論將經典博弈論與實驗經濟學和實驗心理學相結合,從而放寬了經典博弈論中許多不切實際的簡化假設。它偏離了簡化假設,例如完美理性 [55]、獨立公理,以及不考慮將利他主義或公平作為人類決策動機的假設 [56,57]。我們將在這篇評論中展示與行為博弈論相關的方法對於模擬軍事場景(例如信號博弈)至關重要。

2.3.11 進化博弈論

進化博弈論是將博弈論應用到進化生物學領域的結果[58]。進化博弈論中提出的一些關鍵問題包括:哪些種群/策略是穩定的?在其他策略盛行的人群中,哪些策略可以“入侵”(變得流行)?在重複的博弈設置中,玩家如何回應其他玩家獲得或被認為正在獲得更好的回報?進化博弈通常被建模為迭代博弈,其中一群玩家在混合良好或空間分布的環境中迭代地玩相同的博弈。

如果一種策略在流行時有可能阻止任何突變策略滲透其環境,則可以將其識別為進化穩定策略 (ESS)。或者,ESS 是一種策略,如果在給定環境中被人群采用,則不會被任何替代策略入侵。因此,玩家從 ESS 切換到另一種策略沒有任何好處。因此,本質上,ESS 確保了擴展的納什均衡。為了使策略 S1 成為對抗另一個“入侵”策略 S2 的 ESS,就預期收益 E 而言,需要滿足下麵提到的兩個條件之一。

E(S1,S1)>E(S2,S1):通過單方麵改變策略到 S2,玩家將輸給另一個堅持 ESS S1 的玩家。

E(S1,S1)=E(S2,S1) & E(S1,S2)>E(S2,S2):一個玩家,通過轉換為 S2,對另一個堅持 ESS S1 的玩家既不贏也不輸,但是與已經“轉換”到 S2 的玩家對抗,玩家最好玩 ESS S1。

如果滿足這兩個條件中的任何一個,則新策略 S2 無法入侵現有策略 S1,因此,S1 是針對 S2 的 ESS。進化博弈通常被建模為迭代博弈,即群體中的玩家迭代地玩相同的博弈[52]。

三、博弈論在國防科技中的應用

如前所述,在博弈建模防禦場景中影響收益矩陣的主要參數是目標的價值、資源的價值和目標的優先級。除此之外,國防應用程序中使用的博弈可能會有很大差異,我們將在下麵看到。因此,本節的結構基於每篇論文所涵蓋的領域(戰爭類型)。如果一篇論文涵蓋多個領域,則將其包含在最相關的小節/領域中。然而,我們詳細分析了每篇論文所使用的博弈類型、收益函數的結構方式、可用策略和均衡等。

3.1 研究 陸戰 的論文

在博弈論的陸戰相關應用中,大多數研究都集中在防禦戰上,即軍方決定如何最好地將地麵防禦分配給多種威脅。一些研究還關注曆史上的陸上衝突,並在事後提供博弈論分析,揭示了在曆史衝突中憑直覺做出的一些決定如何具有理性和數學上的合理性。陸戰可能導致非常嚴重的人員傷亡,因此了解如何最大限度地減少人員損失是陸戰的關鍵組成部分(盡管不是唯一目標)。很多時候,優先考慮軍事資源也是成功的基礎,並且經常在戰略決策中占據突出地位。此外,通常在涉及地麵戰的場景中,評估有關對手、他們可能的戰術或地形的知識很重要:可能需要與在某些地方部署的空降部隊作戰,或者可能需要穿越不確定的領土。在每一種情況下,了解一支部隊的信息不完善之處將有助於該部隊做出理性的決定。

幾篇論文使用博弈論來模擬當前和曆史背景下的陸戰。比爾等人[65] 設計一個博弈,以最好地將防禦資源分配給一組需要保護的位置/資源。然後攻擊者必須決定他們如何選擇分裂他們的力量來攻擊不同的目標。該博弈被建模為正常形式的兩人博弈。這個博弈的收益是絕對的,對位置 i 的攻擊要麼成功,要麼失敗,攻擊者獲得 ai,防禦者失去 di。由於攻擊命令是在攻擊之前確認的,因此攻擊者必須使用一組純策略。博弈既可以同時進行,也可以依次進行。也就是說,可以根據攻擊者在做出決定之前是否知道防禦者如何分配他們的資源來玩博弈。這導致了一個理想的戰略,即讓一些目標不設防,並通過讓一些地區易受攻擊來加強關鍵地區的防禦。

我們審查的下一篇論文是 Gries 等人[66] 這是對博弈論原理在遊擊戰/破壞穩定戰中的效用的全麵調查。他們建模的重要因素是:破壞穩定的叛亂分子經常隨機攻擊,造成持續的威脅,必須有持續的緩解和檢測策略;戰爭的持續時間很重要,並且會改變分配給目標和資產的價值;時間偏好在確定優先事項方麵起著至關重要的作用,因為價值判斷決定了戰略決策,而戰略決策又決定了成功或失敗。他們提出的博弈模型既包括順序非合作博弈,也包括同時非合作博弈,其中兩個參與者分別是遊擊隊和政府。對於這些衝突,經濟和社會影響比軍事損失和收益更重要,因此在計算結果價值方麵發揮著更重要的作用。博弈特別模擬了雙方試圖尋求和平或與對方發生衝突的時刻。在這些時刻,政府軍必須考慮每種選擇的財務成本,而叛軍則檢查交戰的優先順序,以及他們將為每次交戰提供多少戰鬥力。圖 1 展示了從破壞穩定戰爭的這些時刻出現的決策樹示例,其中 G 代表政府決策,R 代表叛軍決策。

圖 1. 破壞穩定戰博弈 [66],其中突出顯示了政府和叛軍的決策點

Krisnamurthy 等人 [67] 研究無人值守地麵傳感器網絡 (UGSN) 動態行為的博弈論控製,以獲取有關入侵者的信息。該網絡中的每個傳感器都能夠以指定的精度接收附近目標的範圍和方位的測量結果,然後將這些測量結果傳輸到本地集線器進行數據融合。在這個框架中,雖然更多的傳感器測量和更大的測量傳輸量可能會導致更好的目標感知,但這也會導致更多消耗有限電池電量的不良影響。因此,應用博弈論的目標是使用雙時間尺度的分層方法在目標意識、數據傳輸和能源消耗之間進行最佳權衡。

作者證明了傳感器激活和傳輸調度問題可以分解為兩個耦合的分散算法。特別是,傳感器被視為非合作博弈中的玩家,並提出了一種自適應學習策略來根據傳感器與感興趣目標的接近程度來激活傳感器。結果證明這是這種非合作博弈的相關均衡解。接下來,將傳輸調度問題,其中每個傳感器必須在每個時刻決定是傳輸數據並浪費電池電量還是等待並增加延遲,被公式化為帶有懲罰終端成本的馬爾可夫決策過程。該公式的主要結果是表明最優輸電策略具有閾值結構,然後使用超模塊化的概念證明該結構。

有幾項研究使用博弈論棱鏡分析主要發生在陸地上的曆史衝突。例如,Cotton 和 Liu [68] 描述了兩個中國古代軍事傳說,並將它們建模為信號博弈。在這兩款博弈中,傳奇的軍事領袖都麵臨著數量和力量都比自己強大得多的敵對軍隊,但他們並沒有撤退,而是準備交戰,就好像他們正在準備埋伏一樣。他們的對手信息不完全,隻剩下他們可以從對手的行動中推斷出的信息;被這些將軍所擁有的自信和聲譽所嚇倒,敵方軍隊雖然實際上實力更強,但選擇不交戰。通過勇敢而巧妙的虛張聲勢,兩位將軍都堅持自己的立場,從而實現了對他們有利的平衡解決方案。他們通過在沒有直接溝通的情況下製造欺騙來做到這一點,這遵循了上述 Beer-Quiche 信號博弈的模板。

Cotton 和 Liu 描述的第一個博弈是“100 Horsemen”博弈。他們描述了一段曆史,一百名漢族騎兵獨自旅行,遇到了成千上萬的匈奴大軍。他們可用的策略是撤退或參與。如果他們撤退,敵人交戰,他們很可能會被擊潰。如果他們交戰,敵人也交戰,他們將在戰鬥中被消滅。對他們來說最好的結果就是以某種方式迫使敵人撤退。敵人不確定騎兵是否帶著更大的軍隊。他們看到騎兵開始交戰,決定不冒險,撤退。這種情況被轉化為兩人博弈,有兩種策略。如下圖2所示:

圖 2. 100 Horsemen 信號博弈 [68]

在圖 2中:

LG代表漢軍李廣將軍的決策點。

GenX代表了敵對匈奴勢力的決策點。

收益被列為(LG,GenX)

λ∈(0,1) 代表將軍的能力,

α 和 β 代表在撤退中喪生的漢族騎兵比例

w 是一個正參數

第二場比賽與第一場非常相似。在這個博弈中,一座小城由強大的諸葛亮將軍守衛。他得知一支強大的敵對軍隊正在接近這座城市。他麵臨兩個選擇。他可以逃跑,然後他會脫離城市,很可能會被接近的軍隊追殺,或者他可以留下來保衛城市。如果他選擇了後者,大軍出手,他很可能會失去性命、軍隊和城市。麵對這種困境,他命令他的手下隱藏起來,讓城市從外麵看起來空無一人。他爬到城市最重要的塔頂,演奏音樂。對方將軍知道梁將軍的經驗和實力,懷疑將軍在空城的塔樓中采取這種不起眼的位置來伏擊他的軍隊,他們離開了城市以避免被伏擊。梁將軍在這裏有效地發出了兩個信號。首先是他的聲譽,這是一個包含他的戰略和軍事實力的信號。第二個是他選擇留下來保衛這座城市。有了這兩條信息,梁將軍的軍隊的行蹤和規模就沒有了,對方軍隊選擇了零損失的安全選項,離開了。這段曆史被建模為另一個兩人信號博弈,如下圖 3 所示:

圖 3. 空城信號博弈 [68]

在圖 3 中:

ZL代表諸葛亮將軍的決策點

收益被列為(ZL,反對軍)

λ∈(0,1) 代表將軍的能力,

c代表城市的價值

w 代表 ZL 的軍隊與對方軍隊匹配時的收益

y表示ZL的軍隊比對方軍隊弱時的損失,並且y>c因為它包括失去城市

這兩段曆史都代表了麵對近乎確定的失敗時做出的傑出軍事決策,實際上是將軍們對信號的細微差別有深刻理解的例子,並在戰略互動中做出理性決策,迫使他們取得有利於自己的結果。

3.2 研究 海戰 的論文

令人驚訝的是,直接和主要使用博弈論處理海戰的論文相對較少,盡管海戰在人類曆史上比空戰早了相當大的優勢。萊文 [69] 使用博弈論的概念研究過去幾個世紀海戰的各個方麵。在 18 世紀和 19 世紀,當時的強國建造了軍艦,並在其兩側放置了大炮。這意味著船隻通常隻能從側麵攻擊。當作為無敵艦隊航行時,標準的做法是形成“戰線”,即一列盟軍海軍艦艇朝一個方向航行,使他們的兩側麵向敵人,也排成一條線。兩個平行的對立艦隊然後可以用大量的大炮互相攻擊。“戰線”戰略被認為是納什均衡,因為任何一支艦隊都不會從掠奪中獲益(這是當時的一種戰術,攻擊艦船會試圖駛過對手的船尾,在那裏集中炮火,而由於船尾的大炮位置較少,敵人隻能做出最低限度的反應。攻擊艦會損壞對手的船尾和一些舷側)。根據萊文 [69 ] 傾斜在艦隊中不是首選,因為這意味著必須先在敵人前麵航行,然後轉向它——當船隻的速度大致相等且機動困難時,這是一項具有挑戰性的任務。由於兩支艦隊都不會從轉向敵人中獲益,也不會取得領先,萊文得出的結論是,這種策略——形成一條戰線並與另一支艦隊平行航行——是每個艦隊的最佳反應,因此代表了納什均衡。

萊文接著提到了英國艦隊偏離上述戰略並正交駛向法國和法國-西班牙艦隊的戰鬥。在萊文提到的第一場戰鬥中,這很可能是無計劃的。第二次是 1805 年的特拉法加海戰,這是經過精心設計的:英國艦隊將自己分成兩列,每列都垂直於法西線航行,掃射了大約 45 分鍾,然後墜毀並開始了一場一般混戰。英國人將繼續孤立法西艦隊的中部,以取得決定性的勝利。萊文認為這兩場戰鬥都是他論文的反例。然而,在特拉法加戰役中,英國的戰略可能是對可能的法西戰略形成正統戰線的最佳回應。英國海軍上將,納爾遜勳爵希望阻止法西艦隊逃跑——如果兩支艦隊形成平行戰線,他們可以逃跑——從而減少了他將自己的艦隊組成戰線所獲得的獎勵。此外,他可能估計法國和西班牙艦船的低劣炮火會減少掃射的效果,從而減少他直接向法西艦隊衝鋒所獲得的負麵回報。在他看來,與正統的戰線相比,這可能使非正統的選擇成為對可能的法西戰略的更好回應。雖然萊文沒有明確地將這些戰略在那個時代的海戰中歸因於博弈論,但所采用的策略仍然可以通過博弈論分析來證明:這是博弈論“直觀”應用的一個例子,而沒有正式研究它。

Maskery 等人2007 (a) [70] 研究使用網絡使能作戰 (NEOPS) 框架部署反艦導彈反措施的問題,其中多艘艦船進行通信和協調以防禦導彈威脅。在這裏,導彈威脅被建模為離散馬爾可夫過程,它們出現在固定物理空間內的隨機位置,並按照一些已知的目標動力學和製導規律向艦船移動。配備有誘餌和電磁幹擾信號等對抗措施(CM)的船舶被建模為瞬態隨機博弈的玩家,其中個體玩家的行為包括使用 CM 最大限度地提高自身安全,同時與其他基本上旨在實現相同目標的參與者。這個博弈論問題的最優策略是一個相關的均衡策略,並且證明是通過一個具有雙線性約束的優化問題來實現的。這與納什均衡解提出的 tepmaskery2007 分散到一個相關問題但沒有玩家協調的問題形成對比。本文的一個值得注意的貢獻是,它還量化了實施 NEOPS 均衡策略所需的溝通量。本文強調了博弈論方法在分析現代戰爭中至關重要的網絡係統中的最優策略中的實用性。這與納什均衡解提出的 tepmaskery2007 分散到一個相關問題但沒有玩家協調的問題形成對比。本文的一個值得注意的貢獻是,它還量化了實施 NEOPS 均衡策略所需的溝通量。本文強調了博弈論方法在分析現代戰爭中至關重要的網絡係統中的最優策略中的實用性。這與納什均衡解提出的 tepmaskery2007 分散到一個相關問題但沒有玩家協調的問題形成對比。本文的一個值得注意的貢獻是,它還量化了實施 NEOPS 均衡策略所需的溝通量。本文強調了博弈論方法在分析現代戰爭中至關重要的網絡係統中的最優策略中的實用性。

在 [71],Maskery等人2007(b)考慮以網絡為中心的部隊保護一個任務組免受反艦導彈的問題。該模型中的決策者是配備硬殺傷/軟殺傷武器(反措施)的艦船,這些艦船也被認為是博弈論環境中製定該問題的參與者。這些平台必須獨立地就反措施的最佳部署做出關鍵決策,同時它們同時朝著保護任務組成員的共同目標努力。本質上,這是海軍環境中分散的導彈偏轉問題,它被表述為一種瞬態隨機博弈,艦艇可以計算出一個處於納什均衡的聯合反措施策略。在這裏,船隻相互玩博弈,而不是使用導彈。這種方法自然適用於分散的解決方案,當完全通信不可行時可以實施。此外,該公式導致將該問題解釋為已知存在納什均衡解的隨機最短過去博弈。

Bachmann等人[72] 使用非合作的兩人零和博弈分析雷達和幹擾機之間的相互作用。在他們的方法中,雷達和幹擾機被認為是具有相反目標的“參與者”:雷達試圖最大化檢測到目標的概率,而幹擾機試圖通過幹擾來最小化雷達的檢測。Bachmann等人。[ 72] 假設存在瑞利分布雜波時的 Swerling Type II 目標,針對不同幹擾情況下的單元平均 (CA) 和階數統計 (OS) CFAR 處理器描述了某些效用函數。這種博弈論公式是通過優化這些效用函數來解決的尺寸。由此產生的矩陣形式的博弈被求解為雷達和幹擾機的最佳策略,他們從中確定雷達和幹擾機有效實現其各自目標的條件。

3.3 研究 空戰 的論文

空戰通常是一種正常形式的博弈,根據對武器庫不同要素強度的假設和知識,在交戰之前就使用資源做出決定。例如,壓製敵方防空車輛(SEAD)對地對空防禦和地對空導彈(SAM)有效,但對戰鬥機無效。因此,當軍事人員決定在一場交戰中使用哪些資源時,他們需要權衡每項資源的價值,以及目標對衝突雙方的重要性。如果攻擊部隊對目標的重視程度遠高於其實際價值,那麼他們增加的資源支出可能對其整體軍事行動不利。人類通常操作空中武器,

以博弈論為模型的空戰文獻有限。漢密爾頓 [73] 為博弈論在多種空戰情況下的應用提供了綜合指南。漢密爾頓建議使用博弈論來設計戰略,不僅要基於自己的軍事選擇,還要基於對敵人行動的預期。博弈論解釋了與敵人的不同互動,而不是簡單地考慮哪一方擁有更大的最大努力力量。如今,許多軍隊可以適應瞬息萬變的形勢,根據新形勢調整行動。因此,漢密爾頓建議首先確定雙方可用的所有戰術選項。如前所述,將博弈論用於軍事的最基本要素之一是準確了解每項資產的價值——詳細說明雙方的庫存和戰略可能性將最好地闡明所有戰略選擇。對於每個選項,漢密爾頓建議分配一個數值——有效性度量 (MoE)。關於教育部的決策很重要,因為對教育部的準確判斷將支持戰略性選擇。不正確的教育部可能導致不正確的戰略決策,也可能導致對決策錯誤原因的理解不足。這方麵的一個例子(盡管不是在空戰背景下)是越南戰爭,美國早期的戰略是最大限度地壓製越共士兵。由於北越領導層沒有非常重視他們的步兵,美國的戰略最終導致了戰爭的失敗。接下來,漢密爾頓建議計算衝突雙方策略之間所有可能相互作用的組合值。這將產生一個收益矩陣,從中可以得出每個參與者的最優或優勢策略,然後是一個均衡解決方案。因此,在軍事領導人可能參與的任何交戰之前,他們對博弈的預期結果有一個完整的概念。漢密爾頓在這些指導方針中添加的一個警告是從整體上考慮軍事行動的長度。如果替換成本低或數量多,可為一場戰鬥或打擊攻擊分配給資源的值可能很小。但是,根據整個戰役中此類衝突的數量,這些資源可能變得至關重要。

為了說明這些觀點,漢密爾頓將它們應用於 SEAD 和時間關鍵目標的標準空戰博弈。在這場戰鬥中,“藍方”試圖消滅一些地麵目標。為此,他們使用 SEAD。作為回應,“紅方”將發射 SAM,這是 SEAD 難以避免的。然而,在預料到這種反應的情況下,藍方也擁有可以防禦 SEAD 並抵消 SAM 但無法攻擊目標的攻擊機。藍隊的問題是:目標的價值是多少,應該為目標部署多少比例的 SEAD 和攻擊機?同樣,對於紅隊來說:目標的價值有多大,應該解雇多少(如果有的話)SAM?漢密爾頓認為,最佳的紅方策略是隻為一小部分交戰開火,這等於:

最優藍色策略是將部分飛機分配為SEADs,等於:

在這裏,

Pks 是 SAMS 摧毀 SEAD 的概率

PkA 是攻擊機摧毀 SAM 的概率

鑒於飛機和導彈發射的每一種可能分配,這個公式對交戰的可能結果給出了簡明的預測。必須指出的是,在實踐中要準確量化不同目標和資源的數值是非常困難的。

Garcia等人2019 [74] 調查保衛海上海岸線免受兩架敵機攻擊的問題,兩架敵機的主要目標是入侵防禦飛機控製的領土。另一方麵,防禦者試圖通過盡可能遠離邊界連續攔截兩架敵機來防止這種情況發生。這是一個典型的追逃場景,代表了機器人、控製和防禦領域的許多重要問題。在本文中,Garcia等人,地方連續捕獲兩個攻擊者/逃避者,而攻擊者在麵對之前合作並最小化他們與邊界的組合距離。Garcia等人,然後通過求解一組非線性方程,找到攻擊者和防禦者的最優策略。本文討論的合作策略為能力較弱(可能較慢)的代理在執行任務時提供了一種重要的協調方法。

Garcia等人2017 [75] 考慮一個空戰場景,其中被攻擊導彈交戰的目標飛機利用防禦導彈來保護自己,因為它試圖通過最大化自身與攻擊者之間的距離來逃脫攻擊者,而防禦者盡可能靠近它攻擊導彈。該博弈被稱為主動目標防禦差異博弈(ATDDG)。在這篇論文中,作者擴展了之前在這個三方問題上所做的工作,為 ATDDG 開發了一種封閉形式的分析解決方案,如果防禦者導彈進入指定半徑 rc > 0 的捕獲圈內,則防禦者導彈可以擊敗攻擊者。此外,盡管攻擊者采用了未知的製導律,而不是假設它是比例導航(PN)或追蹤(P),但論文中展示的封閉形式的最佳狀態反饋解決方案應該可以工作。最後,作者為目標飛機提供了一組初始條件,如果目標防禦團隊在攻擊導彈采用未知製導法則的情況下發揮最佳作用,則目標飛機的生存得到保證。

Deligiannis等人[76] 考慮在存在多個幹擾器的情況下多輸入多輸出 (MIMO) 雷達網絡中的競爭功率分配問題。雷達網絡的主要目標是最小化雷達發射的總功率,同時為每個目標實現特定的檢測標準。在這個問題中,雷達麵臨著智能幹擾機,這些幹擾機可以觀察雷達發射功率,從而決定其幹擾功率,以最大限度地幹擾雷達。Deligiannis等人,將此功率分配問題視為非合作博弈,其中參與者是中央雷達控製器和幹擾機,並使用凸優化技術解決此問題。此外,它們為這種情況下納什均衡的存在性和唯一性提供了證據,

同樣,He等人[77]考慮多基地雷達網絡中的雷達對抗問題,在智能幹擾器存在的情況下研究聯合功率分配和波束成形的博弈論公式。該網絡中每個雷達的目標是滿足目標的預期檢測性能,同時最小化其總發射功率並減輕潛在幹擾。另一方麵,幹擾機的目標是調整自己的發射功率來幹擾雷達,以保護目標不被檢測到。首先,He等人研究功率分配博弈,每個玩家(雷達和幹擾器)的策略集由他們各自的發射功率組成。然後他們著手解決相應的優化問題,得出雷達和幹擾機的最佳響應函數,並證明納什均衡的存在性和唯一性。接下來,他們再次將存在幹擾時的聯合功率分配和波束形成器設計問題視為非合作博弈,並提出了一種功率分配和波束形成算法,該算法被證明可以收斂到其納什平衡點。

McEneaney等人[78] 研究無人駕駛飛行器 (UAV) 針對地麵目標和防禦單位(如地對空導彈 (SAM) 係統)的指揮和控製問題。這項工作的動機源於無人駕駛空中作戰場景中對作戰計劃和實時調度的要求。該問題被建模為藍色玩家 (UAV) 和紅色玩家之間的隨機博弈,包括 SAM 和地麵目標。每一方都可以有許多目標:例如,一名藍色玩家可能會嚐試摧毀一個戰略目標,同時盡量減少對自己的傷害。另一方麵,紅色玩家可能會試圖對無人機造成最大的傷害,同時保護自己免受無人機的攻擊。

無人機的控製策略由一組離散變量組成,這些變量對應於要攻擊的特定目標或 SAM,而 SAM 的控製策略是“打開”或“關閉”雷達。請注意,當雷達“開啟”時,SAM 對藍色玩家造成傷害的概率會增加,藍色玩家對 SAM 造成傷害的概率也會增加。這個隨機博弈的解是通過動態規劃獲得的,並用一些數值例子來說明。這項工作的主要貢獻是分析了一種基於風險敏感控製的方法,用於不完全信息下的隨機博弈。特別是,這種方法不僅可以處理由於隨機噪聲引起的噪聲觀察,還可以處理在觀察中包含對抗性成分的情況。

Wei等人[79] 開發了一個任務決策係統,用於多個無人作戰飛行器 (UCAV) 協同工作。UCAV的武器是空對空導彈。在論文中,一支由一架無人駕駛戰鬥轟炸機組成的紅色-UCAV 小組,兩側是兩架 UCAV,試圖打擊一個藍色小組的地麵目標。藍隊擁有自己的一套 UCAV,旨在擊敗紅隊。給定導彈對抗其選定威脅的成功取決於攻擊者與威脅之間的距離、它們的相對速度和相對角度。該場景被表示為同時正常形式的博弈,團隊的策略對應於藍隊實體與紅隊實體的分配,反之亦然。在論文中,紅隊或藍隊的回報是基於考慮給定分配的有效性,這又取決於對方球隊分配分組之間的相對幾何形狀。Dempster-Shafer (DS) 理論適用於利用 DS 組合公式來製定收益的情況。這些為每個策略計算的收益為每個團隊然後放入雙矩陣,即每個團隊一個,並使用線性規劃優化方法求解。如果不存在最優納什均衡,則應用並解決混合策略方法。然後,作者開發了一些具有不同幾何形狀的任務場景,並說明了他們的博弈論分配策略的使用。他們使用包含紅色和藍色團隊的實體幾何注釋圖來證明由他們的收益公式確定的分配策略是令人滿意的。

Ma等人[80] 開發了一種博弈論方法,為在超視距 (BVR) 空戰對抗中相互交戰的多個無人機 (UAV) 團隊生成協作占用決策方法。超視距作戰之所以成為可能,是因為導彈技術的發展能夠實現遠程交戰。在論文中,每一方的團隊首先決定其無人機實體的占用位置(笛卡爾空間中的立方體),然後為每個無人機團隊成員選擇參與的目標。目標是讓每一方都獲得最大的優勢,同時經曆最小的威脅條件。應用零和同時雙矩陣博弈來分析問題。對於給定的無人機占用率,考慮射程和武器最小/最大性能標準的高度和距離優勢公式用於生成效用函數的收益值。隨著博弈的規模隨著每個團隊的占用立方體和無人機數量的增加而導致規模(以及策略)的爆炸式增長,作者選擇增強旨在解決大型問題的雙 Oracle (DO) 算法通過將其與鄰域搜索 (NS) 算法結合到雙 Oracle 鄰域搜索 (DO-NS) 中來縮放早期作品中的零和博弈問題。通過仿真,作者說明結果表明 DO-NS 算法在計算時間和解決方案質量方麵優於 DO 算法。隨著博弈的規模隨著每個團隊的占用立方體和無人機數量的增加而導致規模(以及策略)的爆炸式增長,作者選擇增強旨在解決大型問題的雙 Oracle (DO) 算法通過將其與鄰域搜索 (NS) 算法結合到雙 Oracle 鄰域搜索 (DO-NS) 中來縮放早期作品中的零和博弈問題。通過仿真,作者說明結果表明 DO-NS 算法在計算時間和解決方案質量方麵優於 DO 算法。隨著博弈的規模隨著每個團隊的占用立方體和無人機數量的增加而導致規模(以及策略)的爆炸式增長,作者選擇增強旨在解決大型問題的雙 Oracle (DO) 算法通過將其與鄰域搜索 (NS) 算法結合到雙 Oracle 鄰域搜索 (DO-NS) 中來縮放早期作品中的零和博弈問題。通過仿真,作者說明結果表明 DO-NS 算法在計算時間和解決方案質量方麵優於 DO 算法。通過將其與鄰域搜索 (NS) 算法結合到雙 Oracle 鄰域搜索 (DO-NS) 中。通過仿真,作者說明結果表明 DO-NS 算法在計算時間和解決方案質量方麵優於 DO 算法。通過將其與鄰域搜索 (NS) 算法結合到雙 Oracle 鄰域搜索 (DO-NS) 中。通過仿真,作者說明結果表明 DO-NS 算法在計算時間和解決方案質量方麵優於 DO 算法。

Başpınar、Barış等人的工作[81] 專注於使用基於優化的控製和博弈論方法對兩架無人機 (UAV) 之間的空對空作戰進行建模。在這項工作中,車輛運動用特定變量表示,並且通過確定滿足平坦輸出空間中定義條件的平滑曲線來解決從一個航路點移動到另一個航路點的任何軌跡規劃。確定後,所有涉及描述平滑曲線的變量都可以恢複到原始狀態/輸入空間。其影響是通過減少所需變量的數量來加速解決任何軌跡優化。然後利用博弈論,將兩架無人機之間的空戰建模為使用極小極大方法的零和博弈。那是,當對手采取最佳策略時,每一方都試圖最大化其收益。在這裏,目標是讓每架無人機直接落後於另一方,並在滿足機載武器有效射程限製的射程閾值內。

在 [81],作者提供了與基於方位角和方位角追尾目標的程度相關的成本函數,以及當對手處於最佳射擊範圍的某個閾值內時與生成最大得分相關的成本函數. 成本函數相乘以創建總成本。成本函數被放入後退水平控製方案中,其中通過選擇控製確定的軌跡規劃在給定的前瞻時間段內執行,其中兩個參與者都使用相反的策略。每個玩家都將其對手視為視野內的可到達集合,並使用它來選擇其控製選擇以最大化其收益。這個過程每隔幾個控製步驟就重複一次。與該領域的大多數其他作品不同,作者在性能包絡內使用全套控製輸入而不是一個子集(例如,轉彎、保持傾斜、以特定角度向左滾動、伊梅爾曼轉、分裂S或螺旋俯衝),因此指出生成更優化的解決方案對於每個玩家的策略。提供了兩種模擬場景,第一種情況是無人機從空中優勢位置開始,然後執行後退地平線成本函數優化以在最佳射程內與對手進行尾追。作者表明,應用控製時的速度、負載係數和坡度角在飛行期間不會違反界限,並且會生成可行的軌跡。對於第二次模擬,無人機最初處於追尾狀態,但不滿足射程內標準。當追趕者繼續追趕時,被追趕的對手通過應用成本函數進行機動逃跑。在交戰結束時,滿足射擊範圍標準並且目標直接在前方但處於次優方位,這導致其逃跑。這些場景用於證明所開發的控製策略的有效性,從而為兩架相互交戰的無人機提供戰鬥策略的自動選擇。

Casbeer等人[82],考慮這樣一種情況,其中一個攻擊者導彈追擊一個無人駕駛飛行器目標,兩枚防禦導彈從與目標結盟的實體發射,並與目標合作。它延伸自典型的三方博弈場景,其中隻有一枚防禦導彈與攻擊者合作,與目標合作。作者在這裏將其稱為主動目標防禦差異博弈(ATDDG)。除了在 ATDDG 的擴展中計算玩家的最優策略外,本文還試圖確定目標在使用兩名防禦者而不是一名防禦者時降低脆弱性的程度。製定了一個約束優化問題來解決這種情況。結果表明,通過選擇與任一防禦者合作,目標可以更成功地逃脫攻擊者。此外,兩個防禦者的存在使攻擊者更容易被攔截。當兩枚防禦者導彈處於有利位置時,兩者都可以攔截攻擊者。

Han等人 [83] 提出了一個綜合空中和導彈防禦 (IADS) 問題,其中配備攔截導彈 (IM) 的地對空導彈 (SAM) 電池與攻擊者導彈 (AM) 攻擊目標城市。該問題被視為具有完全信息的簡化的兩方零和博弈,具有三個階段。這三個階段對應於防禦者將 SAM 分配給城市,隨後攻擊者將導彈齊射分配給城市,最後防禦者分配攔截導彈以反擊攻擊者導彈齊射。在這個問題中所做的簡化假設是在城市附近隻分配了一個 SAM,每個站點隻安裝一個。此外,對每枚攻擊導彈發射的攔截器不超過一個。此外,一個 DM 隻能分配一個 IM,每個 SAM 具有相同數量和類型的 IM,並且 AM 是相同的,並且在一次齊射中發射。嚐試使用擴展形式博弈樹、α-β 剪枝和對需要保護的六城市網絡使用雙 Oracle (DO) 算法來解決三級博弈。DO 算法是一種啟發式算法,不能保證找到完美子博弈納什均衡 (SPNE)。研究了每種算法選擇達到子博弈完美納什均衡的效率。對於博弈樹方法,得出的結論是,由於問題的組合性質,策略空間的大小被確定為增加到難以處理的大小。在應用 α-β 剪枝時,與 DO 算法相比,本文確定確定 SAM 電池、AM 和 IM 的數量在計算時間方麵不能很好地擴展。但是,DO 算法確實在少數情況下無法找到 SPNE。盡管如此,作者還是更喜歡 DO 算法,因為即使將問題的規模從 6 個城市增加到 55 個城市,它也不會違反單調性(收益增加)和解決方案質量趨勢(計算時間非指數增加)。

3.4 研究 網絡戰 的論文

與網絡安全不同,涉及博弈論在網絡戰中應用的論文很少。其中值得注意的是,Keith 等人。[84] 考慮一個多域(網絡與防空相結合)防禦安全博弈問題。兩個玩家在零和廣泛形式博弈中相互交戰,一個防禦者代表配備網絡戰保護的綜合防空係統 (IADS),另一個攻擊者能夠釋放空對地威脅(導彈、炸彈)以及網絡攻擊(針對 IADS 網絡)。在這裏,收益被選擇為預期的生命損失。防禦者想要最小化它,而攻擊者想要最大化它。保護 IADS 的網絡安全博弈問題嵌套在物理安全博弈問題中。玩家的動作對應於分配激活 IADS/網絡安全響應節點對應於防禦者的人口中心,以及分配給攻擊者攻擊 IADS/相關網絡安全節點的分配。通過提供不完善的信息來增加博弈的真實性;也就是說,防禦者和攻擊者都沒有完全意識到節點的脆弱程度。此外,防禦者隻能在概率上感知對節點的網絡攻擊,這意味著其將網絡防禦團隊分配給特定 IADS 僅在概率上有效。對於攻擊者,它還可以在物理攻擊節點後確定其網絡攻擊的有效性。這項工作旨在通過引入集成域、代理動作的多個時期以及讓玩家不斷混合形式的策略來推進安全博弈文獻。作者認為這是蒙特卡洛(MC)的第一部作品,並且已經在安全博弈中比較了基於折扣和穩健的反事實遺憾最小化 (CRM) 的方法。最初,對於問題的小規模版本,為防禦者確定序列形式的線性規劃形式的納什均衡 (NE)。然後,這個問題逐漸擴大到包括額外的人口中心,以達到上限。在這裏,引入了一種近似 CRM 算法,以減少計算時間,同時盡可能地保持特定策略的最優性。當規模進一步增加時,會引入折扣 CRM,從而進一步減少計算時間。為防禦者確定序列形式的線性程序形式的納什均衡(NE)。然後,這個問題逐漸擴大到包括額外的人口中心,以達到上限。在這裏,引入了一種近似 CRM 算法,以減少計算時間,同時盡可能地保持特定策略的最優性。當規模進一步增加時,會引入折扣 CRM,從而進一步減少計算時間。為防禦者確定序列形式的線性程序形式的納什均衡(NE)。然後,這個問題逐漸擴大到包括額外的人口中心,以達到上限。在這裏,引入了一種近似 CRM 算法,以減少計算時間,同時盡可能地保持特定策略的最優性。當規模進一步增加時,會引入折扣 CRM,從而進一步減少計算時間。

探索問題和算法的參數空間以選擇調整參數的最佳選擇並從算法中提取最佳性能。通過引入有限理性使參與者的理性受到限製,因此他們不一定做出最佳反應。他們隻能管理近似穩健的最佳響應動作。玩家的穩健最佳響應定義為完全保守的 NE 策略和完全激進的最佳響應策略之間的折衷。它引入了玩家策略中的弱點。對於玩家而言,他們的策略利用對手策略的能力被稱為剝削。相反,他們的策略相對於對手的脆弱性被稱為可利用性。當運行所有引入的不同算法時,結果表明納什均衡解是最安全的策略,因為正在播放的最佳動作是不可利用的,但是它不會為玩家產生最高的效用。性能圖表顯示,穩健的線性程序產生最高的平均效用和最高的可利用性比率,同時也消耗了最大的計算時間。數據有偏的 CFR 被認為提供了最佳的權衡,它提供了一個高平均效用、一個有利於利用的利用與利用比,同時在最短的計算時間內運行。它不會為玩家帶來最高的效用。性能圖表顯示,穩健的線性程序產生最高的平均效用和最高的可利用性比率,同時也消耗了最大的計算時間。數據有偏的 CFR 被認為提供了最佳的權衡,它提供了一個高平均效用、一個有利於利用的利用與利用比,同時在最短的計算時間內運行。它不會為玩家帶來最高的效用。性能圖表顯示,穩健的線性程序產生最高的平均效用和最高的可利用性比率,同時也消耗了最大的計算時間。數據有偏的 CFR 被認為提供了最佳的權衡,它提供了一個高平均效用、一個有利於利用的利用與利用比,同時在最短的計算時間內運行。

3.5 研究 太空戰 的論文

在太空戰領域,人力資源和風險不那麼普遍,因此重點更多地放在網絡強度和獨立自主代理之間的交互上,無論是連接的還是其他的。最終,這些方麵的戰爭將以遠遠超出人類認知能力的速度和維度進行。由於交戰中決策的快速性和複雜性幾乎肯定會超出軍事人員的理解範圍,因此博弈論將取代決策者成為整個軟件和控製係統的一部分,並讓未來的技術在製定決策時考慮人/社會因素計算。隨著對連通性和網絡的更多關注,在這些領域取得成功的關鍵取決於有效的溝通渠道和整個係統的共同目標。在這個新興的研究領域,應用博弈論的論文通常與衛星網絡有關。 Zhong等人[85] 設定了優化衛星網絡帶寬分配和傳輸功率的宏偉目標。他們的研究基於討價還價博弈論,必須在幹擾約束、服務質量要求、信道條件以及網絡中每個點的衛星傳輸和接收能力之間達成妥協。幹擾約束和帶寬限製是需要在討價還價博弈中協商的盈餘,每顆衛星使用不同的策略來提高其效用/資源份額。這在複雜性上迅速升級,從模型中最重要的收獲是將問題映射到合作談判博弈框架。

同樣,Qiao 和 Zhao [86] 詳細介紹了衛星網絡中節點的有限能量可用性的一些關鍵問題。他們的論文通過路由算法的博弈論模型提供了解決方案,並使用它來找到不均勻網絡流量的平衡解決方案。該模型定位特定的網絡熱點,這些熱點儲備了大量的能量,並采取措施平均分配資源。這是網絡中多個參與者之間的討價還價/合作博弈的另一個案例。

3.6 與 目標跟蹤 有關的論文

由於目標跟蹤是一個成熟的研究領域,我們發現了幾篇應用博弈論跟蹤問題的論文。其中大多數具有重疊的戰爭領域,並沒有過分強調在特定領域的適用性。例如,Gu等人[87] 研究使用傳感器網絡跟蹤移動目標的問題,該傳感器網絡由能夠提供一些與位置相關的目標測量的傳感器組成。每個傳感器節點都有一個用於觀察目標的傳感器和一個用於估計其狀態的處理器。雖然傳感器之間可以進行一些通信,但這種能力是有限的,因為每個傳感器節點隻能與其鄰居通信。目標是一個智能代理,能夠最小化對手的檢測能力,從而有可能增加跟蹤代理的跟蹤誤差,這一事實使問題更加複雜。Gu等人[87] 在零和博弈的框架內解決這個問題,並通過最小化跟蹤代理的估計誤差,開發了一個魯棒的極小極大濾波器。此外,為了處理傳感器節點有限的通信能力,他們提出了這種過濾器的分布式版本,每個節點隻需要來自其直接鄰居的當前測量和估計狀態形式的信息。然後,他們在具有智能目標的模擬場景中展示了他們的算法的性能,並表明雖然標準卡爾曼濾波器誤差發散,但考慮到對手噪聲的極小極大濾波器可以顯著優於卡爾曼濾波器。

Qilong等人[88] 類似地解決了跟蹤智能目標的問題,但它們模擬了跟蹤玩家也在追逐的場景,重點是保護目標。此外,目標可以向攻擊者/跟蹤者發射防禦導彈。攻擊者對目標和防禦導彈都有視線。目標計劃讓跟蹤器慢慢拉近自己與目標之間的距離,同時進行機動以了解攻擊者的反應。當攻擊者接近碰撞時,防禦導彈被釋放。然後目標和導彈進行通信,利用對攻擊者運動模式的了解,並遵守最佳線性製導法則來摧毀攻擊者。這被建模為攻擊者、目標、和防禦導彈。但是,本文也關注目標與防禦導彈之間的合作博弈,這是一種非零和博弈。對他們來說,收益是通過最小化的未命中距離(理想情況下等於零——與攻擊者的碰撞)以及引導防禦導彈所需的控製努力來計算的。

Faruqi [89] 討論了將微分博弈論應用於導彈製導的一般問題。他們指出,導彈軌跡遵循比例導航 (PN),這是一種通常用於製導導彈的製導法則。這些係統的性能通過線性係統二次性能指數 (LQPI) 來衡量。關於微分博弈論,他們通過用一組微分方程表示導彈導航和軌跡來模擬導彈製導問題。這個問題的一般形式是

在這裏,

:是玩家i w.r.t 玩家 j 的相對狀態

:是我輸入的玩家

:是玩家j的輸入

F:是狀態係數矩陣

G:是玩家輸入係數矩陣

Q:是當前相對狀態的性能指數 (PI) 權重矩陣

S:是最終相對狀態的 PI 權重矩陣

Ri,Rj:輸入的 PI 權重矩陣

Faruqi 主要專注於兩人和三人博弈,而效用函數是基於導彈和目標之間的相對距離向量建模的。Faruqi 表明博弈論可以有效地用於現代導彈中涉及 PN 的導彈製導任務。

Evers [90] 另一方麵,使用博弈論分析了對戰區彈道導彈 (TBM) 的防禦。彈道導彈和核技術的擴散對軍事衝突產生了重要影響,失敗的代價可能導致整個城市的毀滅。很難確定它們的發射,因為它們的射程很大,非常強大,盡管它們的有效載荷可能會有很大差異。在對抗這種威脅時,防禦國確實具有通常有很長的飛行軌跡的優勢,通常分為三個階段,在此期間可以攔截 TBM。Boost 階段標誌著發射和大部分 TBM 上升。推進階段的結束以燒毀為標誌,之後 TBM 進入其中段階段。這一階段是飛行中最長的階段,為防禦者提供了攔截 TBM 的最佳機會。在中段階段之後,TBM 從重新進入大氣層進入其終端階段。這是防禦者攔截導彈的最後機會。飛行路線如圖所示下圖4。

圖 4. 戰區彈道導彈的飛行路徑

導彈在相當長的飛行時間內飛行很長一段距離。然而,從其物理地理位置來看,一個防禦的軍事力量或國家隻能在飛行的終止階段運用其資源來防禦它,此時風險要高得多,失敗的成本也最大。出於這個原因,埃弗斯提出了一種合作戰略,即防禦國與周圍的國家結成聯盟,這樣他們也可以在 TBM 到達撞擊地點的早期階段嚐試攔截它。因此,博弈分為兩個較小的博弈:第一個是合作多人博弈,設計一套策略供國家聯盟在整個 TBM 的飛行路徑中使用,第二個是防禦國與潛在的盟友之間的討價還價和合作博弈。

擊落 TBM 的合作博弈的基礎是一種稱為“射擊-觀察-射擊”的策略。它依賴於一組 N 個國家使用一組策略攻擊目標 - 他們的攔截導彈 - M 每個國家都有自己的自己的攔截概率 Pi。當 TBM 飛行時,N 中的每個國家 n 將發射其導彈來攔截 TBM,然後查看它是否成功消除了威脅。如果失敗,將發射下一個國家的導彈。然後將博弈的問題簡化為優化整個策略集的攔截概率,使其具有阻止 TBM 的可行可能性。博弈論在這裏很有用,因為合作博弈論的原理提供了一個強大的數學框架,通過該框架可以為合作國家的集合達成均衡解決方案。

Evers描述的第二個博弈是基於與其他國家談判結成聯盟。對於這些其他國家來說,參與這場博弈是一種風險,因為這使它們成為攻擊力量的另一個潛在目標。為了解決這場博弈,防禦國必須準確評估攔截器成本節省,即通過阻止 TBM 的影響可以獲得多少收益。隨著這些儲蓄成為合作國家可以分享的盈餘,潛在的盟友隨後就如何分享這些儲蓄進行談判,與他們必須提供的攔截資源成比例。

Shinar 和 Shima [91] 通過高度機動的彈道導彈避開攔截導彈的零和博弈,繼續研究追逃博弈和彈道導彈防禦。更具體地說,它將一個不完美的信息元素與博弈聯係起來,彈道導彈知道它正在受到反導彈導彈的攻擊,但對它們的軌跡或發射位置知之甚少。在這場比賽中,兩名球員分別是彈道導彈和攔截器。如果彈道導彈使用純粹的策略,它很可能會被擊中,因為它要麼 (a) 無法對它幾乎沒有信息的對手做出足夠快的反應,要麼 (b) 會以可預測的方式移動並允許直接的碰撞軌跡。因此,彈道導彈博弈的最佳解決方案是混合策略。

混合策略將在其飛行模式中加入隨機性,在一組純策略上分配概率分布。這些純粹的策略將基於基本的導航啟發式,攔截器可能知道或很容易發現。通過在策略上應用少量快速和隨機的切換,彈道導彈可以最大限度地發揮其避免攔截的潛力,並將複雜的計時計算推回到攔截器上。

Bogdanovic等人[92] 使用博弈論視角研究多目標跟蹤的目標選擇問題。這是多功能雷達網絡中的一個重要問題,因為它需要同時執行體積監視和火控等多種功能,同時有效地管理可用雷達資源以實現特定目標。因此,實際上,他們在 [92] 中解決了雷達資源管理問題,並使用非合作博弈論方法來找到該問題的最佳解決方案。他們在每個雷達都被認為是自主的框架中製定問題;沒有中央控製引擎通知雷達它們的最佳策略,雷達之間也沒有任何通信。首先,他們考慮了一個所有雷達對目標有共同興趣的情況,針對這個問題,他們提出了一種基於最佳響應動力學的分布式算法來找到納什均衡點。然後將此問題擴展到雷達和部分目標可觀測性之間的異構利益的更現實的情況。對於這種情況,他們采用相關均衡的解決方案概念,並提出了一種基於遺憾匹配的高效分布式算法,該算法被證明可以實現與計算密集型集中方法相當的性能。

最後,Parras 等人[93] 研究了一種追逃博弈,涉及無人駕駛飛行器 (UAV) 的抗幹擾策略。博弈在連續的時間框架內運行,因此是動態的,在微分博弈論的幫助下得到解決。在某種程度上是上述工作的高潮,它結合了通信優化、傳感器規避和導航的元素。鑒於無人機需要強大的通信來控製和傳遞信息,這種依賴性使得無人機極易受到幹擾攻擊。幹擾和反幹擾這些通信有多種策略,這可以被認為是無人機必須嚐試優化其通信能力的零和博弈。幹擾代理的位置和運動通常存在不確定性,因此該博弈是一個不完全信息微分博弈。無人機最重要的回報是避免因幹擾而失去通信,它可以通過機動來近似幹擾代理的距離,從而避免它們。

3.7. 涉及國家安全的論文

博弈論解決的國土安全的關鍵組成部分是網絡安全、恐怖主義威脅建模和國防合同。在計算機科學中有許多應用 [94,95,96],博弈論非常適合網絡安全問題。博弈論結合了計算機科學嚴格的數學嚴謹性,以及更多的心理和哲學元素,如攻擊者的動機和心態,以及人類在網絡安全中的脆弱性。恐怖主義建模同樣受益於博弈論的心理學風格,因為恐怖活動的許多影響不容易量化,包括受恐怖威脅影響的社會、經濟和其他領域,所有這些都是在博弈論環境中建模的。最後,博弈論適用於承包和分包等主題,因為它有效地捕捉了自私個體之間的相互作用 [1,2],這已被用於模擬國防承包商的行為。

Litti [97] 的論文簡要總結了如何更精確地更新傳統網絡安全啟發式方法,以及博弈論如何幫助網絡安全工程師設計策略以正確預測、緩解和處理受威脅的網絡。他開發了一種定性方法來評估網絡攻擊的潛在風險和成本。雖然是一篇相當短的論文,但它確實提供了一些實踐中博弈論的網絡安全情境示例。例如,他模擬了一個兩人零和博弈來代表攻擊者和安全係統。節點有自己的相互依存關係、漏洞和安全資產,但要合作以最大限度地減少攻擊者破壞係統的可能性。

Jhawar等人[98] 提供了一種更具體的博弈論方法,即攻擊防禦樹 (ADT),用於對涉及網絡安全威脅的場景進行建模。在這裏,ADT 用於在配備自動防禦協議的係統上映射潛在的攻擊和防禦場景。該係統需要全麵解決所有可能的漏洞,並生成適應網絡安全攻擊不斷變化的情況的響應。目前,ADT 僅提供前期係統分析。為網絡安全製定反應策略很重要,因為攻擊者會不斷改變攻擊策略,因此實時響應的時間可以決定係統防禦的成功與否。在 Jhawar 等人[98] 他們模擬了一個簡單的攻擊者和防禦者博弈——黑客和安全網絡管理員。黑客試圖破壞係統的完整性,並且對於他們所做的每一步,管理員都會根據攻擊者的嚐試設計一種反應策略。這種方法的最大效用在於能夠將長而廣泛的形式博弈轉換為圖形布局,以便於理解和交流。

Gonzalez[99] 清楚地勾勒出攻擊者和防禦者的標準兩人競爭博弈,然後利用基於實例的學習理論和行為博弈論。前者將認知信息編譯成稱為實例的表示。每個實例都有一個由情境、決策和效用三部分組成的結構——一個標準的博弈。然而,實例之間的交互對這種方法至關重要。基於實例的學習理論使用從每個實例的結果中學習來反饋到下一個實例的情況,希望在以後的迭代中產生更好的決策。這與機器學習中的強化學習技術非常相似。另一方麵,行為博弈論涉及設計一種策略,我們評估各種因素,對目標和資源進行更精確的長期評估,使效用分數更接近地反映現實生活價值。博弈論再次促進了網絡安全應用程序中社交信息的訪問,並評估了這將如何影響博弈中雙方玩家的行為。其他關鍵因素包括玩家的動機因素、每個玩家的信息完整性以及玩家和技術之間的技術限製和低效率。Gonzalez 強調,在任何網絡安全模型中考慮這些因素的重要性將有助於製定更現實和有用的網絡防禦政策。博弈論有助於在網絡安全應用程序中訪問社交信息,並評估這將如何影響博弈中兩個玩家的行為。其他關鍵因素包括玩家的動機因素、每個玩家的信息完整性以及玩家和技術之間的技術限製和低效率。Gonzalez 強調,在任何網絡安全模型中考慮這些因素的重要性將有助於製定更現實和有用的網絡防禦政策。博弈論有助於在網絡安全應用程序中訪問社交信息,並評估這將如何影響博弈中兩個玩家的行為。其他關鍵因素包括玩家的動機因素、每個玩家的信息完整性以及玩家和技術之間的技術限製和低效率。Gonzalez 強調,在任何網絡安全模型中考慮這些因素的重要性將有助於製定更現實和有用的網絡防禦政策。

網絡安全的一種常見用途是預防恐怖主義。Hausken等人 [100] 使用一些指導性博弈論原則涵蓋了恐怖主義和自然災害建模。恐怖主義和自然災害通過反恐、防災和防萬災投資進行防禦來解決。對這些事件中的每一個發生的可能性進行預測,防禦者必須對每個防禦的投資金額做出戰略決策。在每種情況的效用函數中要考慮的成本包括恐怖分子的情報或自然災害的隨機性/環境控製;攻擊/災難的強度,以及恐怖分子和防禦者對目標價值的評估差異。本分析中使用的博弈論方法捕捉了防禦者在對抗每種威脅方麵所做的努力。根據每個事件發生的可能性,結合每個防禦係統的成本,防禦者可以獲得最佳的資金分配。

Kanturska等人[101] 對在不同位置的攻擊概率未知時如何使用博弈論評估傳輸網絡可靠性進行了嚴格檢查。隻要旅行成本相對於攻擊造成的潛在損失較小,該方法就傾向於使用極小極大算法在多條路徑上分配風險。這將有助於評估與安全護送貴賓通過城市相關的潛在風險。博弈論在這種情況下很有幫助,因為它可以在攻擊概率未知時分析網絡可靠性。

Bier[102] 為政策見解和投資決策、保單保費等提供基於博弈論的有用建議。她的工作討論了最薄弱環節模型:一種將所有資源集中在防止最壞效用情景的策略。這在實踐中通常並不理想,她建議考慮通過針對不同潛在目標的各種防禦策略來對衝這些投資。該論文考慮了恐怖分子/防禦者博弈,以及安全投資如何改變整個社區的攻擊者與防禦者互動的格局。這主要是通過它自己的範圍研究來完成的,其中一個關鍵結論是恐怖主義緩解係統可以從博弈論中受益,因為它增加了對恐怖分子對任何防禦機製的反應的額外考慮。因此,博弈論,

Cioaca [103] 調查了與 Bier 等人類似的問題。[65] 如前所述,但特別關注航空安全。通過針對機場安全措施的成本和維持穩定和有彈性的防禦係統的成本來總結這個問題。關鍵策略是:完全防止攻擊或威脅(通過刪除對目標位置的所有訪問權限或在航空公司未能遵守規定的指導方針時限製他們的權限);管理攻擊的時間維度(攻擊的長度和隨後從中恢複的時間);了解所有直接和間接損失(包括人員傷亡和相關損害,如汙染或感染、二級安全措施受損或聲譽/信號影響);以及緩解、響應和恢複的成本。

該模型是圍繞幾個因素和參數建立的。首先也是最關鍵的是人員損失和物質損失。 H 指人員損失,D 指物質損失,指分配給相關安全係統的預算。攻擊中最明顯和最直接的損失,這兩種損失在這種攻擊中是非常負麵的回報,並且通常比任何防止它們的成本都要高。人員損失 H 難以用數值量化,因此在對資源劃分進行適當評估時,了解如何在不同人群和不同維度上最小化人員損失是該問題最困難的方麵之一。物質損失 D 可以用貨幣量化,但這種損害的連續影響通常是造成重大損失的地方。這些損失可能導致基礎設施全麵關閉、設施停止運營、工人失業,甚至可能導致設施的緩慢衰退和完全關閉。這場比賽的第二個主要因素是分配給安全係統的預算。組織和管理機構將隻有一定數量的資源分配給安全係統 T。下一個因素是安全係統組件的數量,因為這將是預算的組成方式。這些組件中的每一個都被劃分為 n 個單獨的係統子組件之一。這些組件被劃分為多個目標,並且這些目標中的每一個都被分配了一個被攻擊的概率和一個值。這可以正式表示為:

對於任何資源劃分係統,Ciaoca 主張建立衡量係統彈性的維度。這分為靜態彈性,資源的有效分配;動態彈性,衝擊後係統的恢複速度,包括長期投資流入。這兩種形式的彈性表示攻擊之前、期間和之後的係統強度。在博弈論方麵,Ciaoca 的研究清晰地定義了一個博弈,並結合了無數複雜且相互關聯的參數,勾勒出一個有效且可計算的博弈模型。

我們討論的關於國家安全的最後一篇論文是由 Gardener 和 Moffat [104] 撰寫的。本文涵蓋了製定戰略以評估國防承包商及其履行合同義務的潛在績效/能力的概念。用博弈論的說法,這個問題可以用合作和背叛來表達。加德納和莫法特提出了量化方法,國防部可以通過這些方法更嚴格地評估合同和招標方案,從而明智地選擇承包商並保護他們的預算。Gardener 和 Moffat 進一步了解了國防采購項目不同招標階段項目管理的變更要求。他們關注的因素是樂觀的陰謀,由於對項目進度的不合理預期,項目逐漸失控——超過了預算限製和必要的最後期限。通常,這種“陰謀”是為了獲得短期收益,實際上會導致整體損失。所玩的投標博弈不再是關於項目的成功,而更多地是關於利潤資本化,並可能進一步退化為相關國防部與整個承包商行業對抗的兩人博弈。

3.8 研究 其他/混合戰爭 的論文

一些論文在防禦環境中使用博弈論,但不能輕易歸類為上述任何類型,或者與混合戰有關。例如,Zhang和 Meherjerdi [105] 研究如何在不同的通信框架中使用博弈論方法來使用和控製多組無人駕駛車輛。將單個無人駕駛車輛的任務分配給多個無人駕駛車輛會產生更有效的任務分配和性能。將勞動力從一輛強大的單一車輛分離到幾輛較小的車輛提供了靈活性、適應性和改進的容錯能力。這種網絡的用途是監視、探索、衛星集群、結合無人駕駛水下航行器 (UUV) 和潛艇、飛機和無人駕駛飛行器 (UAV) 以及協作機器人偵察。從這個列表中可以明顯看出,該策略非常強大,因為它能夠跨多個域組合資源。

同樣,可以注意到,搜索是一種“捉迷藏”遊戲,在軍事應用中有著悠久的曆史[106,107,108,109,110,111,112,113,114,115]。該理論是由 Koopman [106] 率先在軍事背景下(尋找逃跑目標)提出的,隨後是 Stone 等人的發展[107],應用包括潛艇狩獵、探雷、救援行動、第一響應者的風險以及危險源的定位 [106,107,108,109,110,111,112,113,114,115]。該框架提供了最優的先驗給定檢測模型、目標運動和搜索成本的搜索計劃。搜索成本可能包括搜索時間、逃生概率(對於目標)、暴露風險(對於搜索者)、信息熵或態勢感知(目標位置概率圖)。搜索器可以是移動平台(UAV、UUV、巡邏艇、直升機、機器人、人),目標可以是靜態的、可移動的、盲目的、無聲的或發射的。在這種情況下,經常使用同時定位和映射(SLAM)算法[116]。這一利基市場的新研究方向(受一些生物學應用的啟發)采用了信息趨向的思想 [117],或基於從環境中提取的信息(熵)增益(零星測量、禁區、搜索者之間的通信)實時控製搜索者的移動。博弈論的原理可以應用在可以建模為“捉迷藏”遊戲的環境中。

四、分類及影響

4.1 論文分類

在上一節中,很明顯,許多論文在多個領域都有適用性,並且使用了無數類型的博弈並為一係列玩家建模。因此,必須以有原則的方式對已審查的論文進行分類。為此,我們使用第 2 節表 1中已經介紹的分類方案。

特別是,可以根據 (1) 戰爭的領域或類型 (2) 論文中使用的一種或多種博弈類型,以及 (3) 論文中建模的玩家的性質對所審查的論文進行分類。該領域可以大致分為傳統(T)或現代(M),更具體地說,可以分為陸戰、海戰、空戰、網絡戰和太空戰。根據博弈是非合作的還是合作的、順序的還是同時的、離散的還是連續的、零和還是非零和,所使用的博弈類型也可以有一個複雜的分類。最後,博弈可以是兩人、三人或多人(多於三人)博弈。所有這些都在表 1中進行了簡要介紹。

在表 2中,我們提供了基於上述分類方案的所有評論論文的不言自明、詳盡的分類。

表 2.使用表 1 對國防博弈論應用領域的論文進行分類。此處描述的共有 29 篇論文被分類。

4.2. 審查論文的影響相關指標

我們現在考慮這些論文中哪些最引起研究界的興趣或導致後續或相關工作的問題。衡量這種影響的一個常用指標是引用計數,盡管顯然這個指標偏向於早期的論文。盡管如此,在表 3中,我們展示了所考慮的 29 篇論文的 Google Scholar 引用數。哪些論文被引用次數最多,讀者不言而喻,我們不再贅述。然而,我們強調,引用次數並不是衡量影響力的唯一指標,也不一定是衡量一篇論文在研究領域的影響力的最有效方法。但是,它是一種容易獲得的度量,可以傳達有用的信息。

表 3. 已審查論文的 Google Scholar 引用數。穀歌學術引文數據於 2021 年 12 月 18 日訪問。

表 3還顯示了所考慮的每篇論文的來源國,被定義為出現在通訊作者的第一個單位中的國家。可以看出,被考慮的論文是由來自美國、英國、澳大利亞、中國、荷蘭、加拿大、以色列、印度、德國、西班牙和羅馬尼亞的研究人員撰寫的。似乎將博弈論應用於國防科學的主要興趣存在於美國、歐洲(尤其是西歐)和中國,而我們承認可能有幾篇我們沒有考慮到的用英語以外的其他語言撰寫的論文。

為了了解上述分類中描述的不同領域的想法是否有足夠的交叉授粉,我們考慮了 29 篇審查論文中有多少論文引用了同一組中的其他論文。根據穀歌學術,引用如表 4 所示。令人驚訝的是,沒有一篇論文被其他審查過的論文引用超過兩次,而且大多數論文根本沒有被該集中的其他論文引用。盡管該集合中論文的總體引用次數是健康的——根據表 3,審查的論文平均被引用 34.97 次,有幾篇論文被引用超過 50 次。然而,這些引用大多來自與國防科學和技術有關的論文,這些論文使用各種方法和工具來解決類似的問題,很明顯,在國防應用中使用博弈論的研究人員之間幾乎沒有交叉授粉。因此,除了我們在下麵介紹的文獻中的“空白”(表明潛在的研究機會)之外,還應該強調的是,應該提高對該領域類似作品的認識,這可能會導致在特定領域產生想法在與國防相關的其他領域和其他應用中被重新使用。

表 4. 根據 Google Scholar 審查的論文中的引用。Google Scholar 引文數據於 2021 年 12 月 18 日訪問。從該表中可以看出,在該領域中相互引用對方的工作極為罕見。

5. 進一步研究的機會

審查的論文表明,博弈論可以提供一個統一的框架來分析代理在防禦環境中的決策行為。在本節中,我們將簡要討論迄今為止尚未應用博弈論但如果在未來應用將做出有用貢獻的一係列潛在防禦場景。

國防高級研究計劃局 (DARPA) 最近對“馬賽克戰”[118] 的調查是博弈論未來潛在應用的一個例子。Zhang[105]中提到了這個想法,在操作多輛無人駕駛車輛的情況下,並建議在“馬賽克”網絡中互連許多具有成本效益的小型資源,這樣,如果多個單元被破壞,網絡的整體完整性仍然存在,就像一個即使移除了幾塊瓷磚,馬賽克也會保留其圖像。目標是,如此龐大的資源陣列具有不同的能力,將能夠以其完整性和複雜性壓倒敵人。它利用並發原理來解決數百萬傳感器和執行器係統中連接的複雜性。這些係統又必須處理係統間通信。如果成功實施,這樣的係統係統可以為軍事戰略家提供極其強大的武器和資源網絡,它可以憑借其動態的龐大規模和複雜性擊敗對手。這種組合武器庫不同部分的方法最大限度地提高了每個部分的利益,並重新引入了對資源可消耗性的關注,而不是專注於幾件高價值武器。這反過來又在策略中建立了彈性和適應性,從重量級的單一焦點攻擊方法轉變。由於有大量低成本資源需要合作以獲得最佳結果,這種情況可以建模為一個層次的多人合作博弈,而與對手的衝突可以建模為多人非合作博弈。可以指出的是,“馬賽克戰爭”的概念在本質上類似於更普遍的基於主體的建模概念,該概念已被用於幾種不同的情況,從不老航空航天飛行器設計[119]到傳染病動力學建模[120],博弈論已經成功地應用於其中一些情況[120,121]。

在海戰背景下,博弈論可以有效應用的另一個領域是海軍敏感性。在分析海軍敏感性時,海軍艦艇會考慮其環境、運動模式和潛在的對手傳感器,以計算它們在秘密移動時被檢測到的風險[122]。這種應用在國防科學中常用的跟蹤問題之間存在重疊,正如 Gu [87] 中所解釋的,它描述了使用傳感器網絡進行跟蹤。如前所述,這種情況可以建模為兩人非合作差異博弈,檢測是每個玩家的主要收益參數。

事實上,基於地麵的跟蹤問題也可以從博弈論的應用中受益,到目前為止,該領域的論文很少。地麵跟蹤問題可能出現在地麵軍事應用(此處歸類為陸戰)以及國內安全和反恐應用(此處歸類為國家安全應用)中,其中安全機構跟蹤個人的能力'整個社會的運動——包括他們的位置、他們的社交網絡和他們的動機——是一項至關重要的能力[123]。後一種情況可以建模為追求和逃避的兩人博弈,或者可能隻是追求和偵察,目的是不向目標透露追求,而目標會嚐試識別追求。在這種情況下,從隱蔽跟蹤中獲得的預測信息量將是回報。

網絡戰建模是博弈論可以應用的另一個領域,同樣,正如前麵相關部分所述,除了主要來自計算機科學領域的論文之外,很少有論文涉及這一領域網絡安全。金等人。[124] 描述了所有軍事行動不可或缺的網絡戰場景,並強調了物聯網 (IoT) 和腦機接口等新技術範式所發揮的關鍵作用。防禦專家越來越需要預測和先發製敵的網絡戰策略。使用新穎的技術接口對涉及網絡戰場景的決策製定場景進行建模是博弈論可以發揮重要作用的領域。

如上所述,根據表 4 ,在所呈現的文獻中,似乎很少有交叉、思想交流,甚至對其他類似作品的認識,這也可能被認為是一個“空白” 。因此,在國防應用中使用博弈論的研究人員之間加強合作是可取的,這將導致博弈論方法在多個戰爭領域的重用。

6. 討論

除了總結最新技術和找出文獻中的空白之外,這裏還需要討論這樣的評論如何為該領域增加價值。據觀察,在選定的論文集中,從一篇論文到另一篇論文的引用很少見。雖然很難確定其原因,但可以觀察到,大多數研究都集中在特定的戰爭領域,例如陸戰、海戰或空戰,並試圖解決特定戰爭領域的特定問題。因此,一篇專注於不同戰爭領域的論文不一定被認為是另一篇將博弈論應用於國防領域的論文,而是一篇屬於不同戰爭領域的論文,因此沒有被研究。然而很明顯,這種方法可能會導致錯失機會,因為通常沒有考慮到其他地方可以類似地應用相同的博弈論工具集。像這樣的評論論文將在某種程度上糾正這個問題。此外,可以觀察到,收益函數通常是根據傳統上被認為是特定類型戰爭的重要參數的東西來嚴格和狹隘地定義的。例如,陸戰側重於最大限度地減少傷亡,而國家安全應用側重於增強公眾信心。然而,在大多數類型的戰爭中,有一係列因素促成最終的回報,從傷亡和軍事資產損失到公眾信心、間接經濟成本、機會成本、盟友成本、以及政治和戰略考慮。這篇評論論文可能會通過對多個戰爭領域的收益結構進行廣泛概述,來激發在使用博弈論的每個戰爭領域中對更全麵的收益函數進行建模。此外,在一般意義上,本次審查將有助於強調與國防相關的決策製定是一個有條理和理性的過程,可以進行結構化分析,而不是像過去在辯護的某些部分中所認為的那樣是一個直觀的過程社區 [125]。同時,所提出的分析一方麵有助於避免微觀管理,另一方麵有助於避免衝動的決策[126],而不是鼓勵國防應用中的定量決策過程。

特別是,除了運營和戰術決策過程之外,所提出的審查還具有管理和社會影響。

6.1 管理影響

博弈論的應用對一個國家的國防力量非常有用,不僅在戰術和作戰事務方麵,而且在和平時期的國防資產戰略管理方麵也是如此。例如,出於威懾和戰備目的而對戰艦、潛艇和戰鬥機等軍事資源的戰略布局,可以被視為合作博弈或等效的優化問題,可以通過線性規劃或非線性規劃。同樣,關於戰略軍事設施的布局和建設的決定,例如基地、簡易機場、港口,甚至公路和鐵路 [127,128] 可以通過使用合作博弈論對相關場景進行建模來輔助。另一個可以應用博弈論的管理決策過程是預備役軍事人員的管理,包括何時召集預備役。因此,博弈論不僅對做出作戰決策的軍事人員有用,而且對必須做出與國防相關的決策的文職管理人員和政治家有用,包括在和平時期,這可能會產生長期後果。

6.2 社會影響

將博弈論應用於國防場景的社會效益主要來自國家安全的觀點。公眾對國土安全的看法是國防考慮的重要組成部分,對國防開支有相當大的影響[129]。國防和執法部門的決策者不僅要考慮實際的風險和威脅,還要考慮感知到的風險以及受其影響的因素,例如保險成本、對旅遊業的影響、信用評級機構的評級、投資者在一個國家投資的意願、安全措施的實際成本和預期成本等,以決定國防開支。博弈論可以是一個非常有用的工具,可以對如此複雜的一組因素和參數進行建模,以及在不同場景中產生的總體收益。相反,此類決定一旦做出,顯然會影響國家安全,進而影響公眾對國家安全的信心和認知。因此,風險感知和國家安全支出相互影響[130,131],博弈論提供的工具集對於模擬這樣一個複雜的反饋循環非常有用。顯然,公眾情緒和對事件的看法在戰時情景中也很重要,在所有戰爭領域做出的決定都會影響公眾的看法,這反過來又可能影響衝突的軌跡。因此,博弈論在防禦場景中的應用具有明顯的社會意義。

同樣重要的是要注意,這篇評論增加了新的見解,有助於理解指揮和控製戰。一個這樣的見解是智能代理之間的合作和敵對競爭並沒有乍看起來那麼根本不同:事實上,從某種意義上說,它們都可以用相同的框架(博弈論)來表示,並且都涉及聰明的玩家數量、策略和收益。不同之處在於敵對競爭由非合作博弈論表示,其中一個玩家的收益增加通常會導致另一個玩家失敗(零和博弈是這種情況的一個特例)。另一方麵,合作以合作博弈論為代表,我們在其中模擬聯盟,有時討論“公共利益”的概念。當敵對玩家可能變成盟友或反之亦然時,這種洞察力特別有用。另一個見解是,將防禦場景建模為博弈的主要困難不是來自識別可能的策略或參與者,而是來自量化收益。很多時候,我們審查過的論文在量化收益時做出了一些假設、簡化和估計,並且可以設想這些過程引入的累積誤差可能已經嚴重改變了博弈的結果,從而呈現了建模無效。因此,許多論文在應用博弈論時麵臨的主要挑戰是準確或明智地對收益進行建模。除非對博弈論的幾種防禦應用進行廣泛審查,否則無法獲得這樣的見解,

7. 結論

博弈論已被證明是一種通用且強大的工具,可用於深入了解許多領域的智能體和參與者的決策過程。在這篇評論文章中,我們詳細闡述了博弈論可以應用於國防科學技術的幾種場景,並簡要回顧了該方向的現有研究。我們根據所研究的戰爭類型、使用的博弈類型和玩家的性質,對 29 篇評論論文進行了廣泛的分類。基於所觀察到的結果,我們發現了博弈論目前尚未得到廣泛應用但在未來具有巨大應用潛力的文獻中的空白;我們討論了博弈論防禦應用在未來可能擴展的潛在方向。

基於領域的分類是采用的主要分類模式,在此背景下,我們將審查的論文分為陸地、空中、海洋、網絡和空間領域。我們還考慮了主要與跟蹤和國家安全有關的論文。對於所考慮的每篇論文,都定義了參與者的數量和角色以及博弈類型,並在可能的情況下討論了策略和收益函數。本練習的目的是確定最常分析的領域以及經常使用的博弈類型,並利用這些知識來確定文獻中的空白,並在國防背景下跨各種領域和戰爭類型交叉傳播想法。

希望這次審查將產生幾個積極的結果。我們發現了文獻中的空白,並指出博弈論提供的工具集在分析某些戰爭模式時並未得到充分利用。例如,我們指出,使用博弈論分析的海戰論文相對較少。我們還注意到,可以通過應用博弈論來分析新興的戰爭模式,例如馬賽克戰。因此,本次審查可能會導致更多的博弈論方法來模擬這種戰爭模式。此外,我們強調了該領域內的引文網絡非常稀疏:也就是說,在國防應用中使用博弈論的各種研究人員之間的思想交叉授粉是很少見的。這篇綜述可能會成為該領域研究人員之間合作和交叉授粉的催化劑。然而,最重要的是,這篇評論旨在向迄今為止尚未使用博弈論的國防科學家強調博弈論在國防應用中的效用,因此將為國防科學家引入一套新的工具,他們可以將其應用於他們的研究.

隨著世界應對和平與穩定麵臨的新挑戰,人類的未來取決於我們和平解決問題的能力。雖然這是一個崇高的目標,但權力的投射絕對比實際的武裝衝突要好,後者在許多層麵上都會付出很高的代價,博弈論確實可以在決定一些可能發生的“軟衝突”中發揮作用在未來幾年和幾十年裏。隨著未來幾年對國防戰略和能力的關注可能會增加,博弈論可以作為一種額外的工具,國防科學家可以在許多抽象層次上使用它來解決部署、感知、跟蹤和資源分配問題。

資金

這項研究是由澳大利亞國防科學技術集團資助的。

參考文獻

成為VIP會員查看完整內容
52
0

華南師範大學等《知識蒸餾》最新綜述論文

高性能的深度學習網絡通常是計算型和參數密集型的,難以應用於資源受限的邊緣設備. 為了能夠在低 資源設備上運行深度學習模型,需要研發高效的小規模網絡. 知識蒸餾是獲取高效小規模網絡的一種新興方法, 其主要思想是將學習能力強的複雜教師模型中的“知識”遷移到簡單的學生模型中. 同時,它通過神經網絡的互 學習、自學習等優化策略和無標簽、跨模態等數據資源對模型的性能增強也具有顯著的效果. 基於在模型壓縮和 模型增強上的優越特性,知識蒸餾已成為深度學習領域的一個研究熱點和重點. 本文從基礎知識,理論方法和應用 等方麵對近些年知識蒸餾的研究展開全麵的調查,具體包含以下內容:****(1)回顧了知識蒸餾的背景知識,包括它的 由來和核心思想;(2)解釋知識蒸餾的作用機製(3)歸納知識蒸餾中知識的不同形式,分為輸出特征知識、中間特 征知識、關係特征知識和結構特征知識;(4)詳細分析和對比了知識蒸餾的各種關鍵方法,包括知識合並、多教師 學習、教師助理、跨模態蒸餾、相互蒸餾、終身蒸餾以及自蒸餾;(5)介紹知識蒸餾與其它技術融合的相關方法, 包括生成對抗網絡、神經架構搜索、強化學習、圖卷積、其它壓縮技術、自動編碼器、集成學習以及聯邦學習;(6)對知識蒸餾在多個不同領域下的應用場景進行了詳細的闡述(7)討論了知識蒸餾存在的挑戰和未來的研究方向.

1. 引言

深度學習由於對目標多樣性變化具有很好的魯 棒性,近年來得到廣泛的關注並取得快速的發展. 然而性能越好的深度學習模型往往需要越多的資 源,使其在物聯網、移動互聯網等低資源設備的應 用上受到限製. 因此研究人員開始對高效的(Efficient)深度學習模型展開研究,其目的是使具有高性能 的模型能夠滿足低資源設備的低功耗和實時性等要 求,同時盡可能地不降低模型的性能. 當前,主要 有 5 種方法可以獲得高效的深度學習模型**:直接手 工設計輕量級網絡模型、剪枝、量化、基於神經架 構搜索(Neural Architecture Search,NAS)[1]的網絡自 動化設計以及知識蒸餾(Knowledge Distillation,KD)[2]**. 其中,知識蒸餾作為一種新興的模型壓縮方 法,目前已成為深度學習領域的一個研究熱點和重 點. 國內外許多大學和研究機構已經對知識蒸餾展 開了深入研究,並且每年在機器學習和數據挖掘的 國際頂級會議和知名期刊中都有關於知識蒸餾的文 章發表.

知識蒸餾是一種教師-學生(Teacher-Student)訓 練結構,通常是已訓練好的教師模型提供知識,學 生模型通過蒸餾訓練來獲取教師的知識。它可以以 輕微的性能損失為代價將複雜教師模型的知識遷移 到簡單的學生模型中. 在後續的研究中,學術界和 工業界擴展了知識蒸餾的應用範疇,提出了利用知 識蒸餾來實現模型性能的增強. 基於此,本文根據 應用場景劃分出基於知識蒸餾的模型壓縮和模型增 強這兩個技術方向,即獲得的網絡模型是否為了應 用於資源受限的設備. 圖 1 給出了這兩種技術對比 的一個例子,其中的教師模型都是提前訓練好的複 雜網絡. 模型壓縮和模型增強都是將教師模型的知 識遷移到學生模型中. 所不同的是,模型壓縮是教 師網絡在相同的帶標簽的數據集上指導學生網絡的 訓練來獲得簡單而高效的網絡模型,如左圖的學生 是高效的小規模網絡. 模型增強則強調利用其它資 源(如無標簽或跨模態的數據)或知識蒸餾的優化策 略(如相互學習和自學習)來提高一個複雜學生模型 的性能. 如右圖中,一個無標簽的樣本同時作為教 師和學生網絡的輸入,性能強大的教師網絡通常能 預測出該樣本的標簽,然後利用該標簽去指導複雜 的學生網絡訓練.

本文重點收集了近些年在人工智能、機器學習 以及數據挖掘等領域的國際頂級會議(如 ICCV, ICML,EMNLP,KDD)與重要學術期刊(如 PAMI, TOIS,TKDE,TMM)上有關知識蒸餾的論文並加以 整理、歸納和分析. 據我們所知,目前國內沒有知 識蒸餾相關的中文綜述,而先前兩篇英文綜述[3,4] 和我們工作相似,但本文進一步完善了知識蒸餾的 綜述. 具體地,本文與先前的英文綜述[3,4]至少有以 下三點的不同:

  • (1)先前的研究都忽略了知識蒸餾在模型增強 上的應用前景。在本文的研究調查中,知識蒸餾不 僅可以用於模型壓縮,它還能通過互學習和自學習 等優化策略來提高一個複雜模型的性能. 同時,知 識蒸餾可以利用無標簽和跨模態等數據的特征,對 模型增強也具有顯著的提升效果.

  • (2)先前的研究都沒有關注到結構化特征知 識,而它在知識架構中又是不可或缺的。 某個結構 上的知識往往不是單一的,它們是有關聯的、多個 知識形式組合. 充分利用教師網絡中的結構化特征 知識對學生模型的性能提升是有利的,因此它在近 兩年的工作中越發重要[5,6].

  • (3)本文從不同視角給出了基於知識蒸餾的描 述,並提供了更多的知識介紹。 在知識蒸餾的方法 上,本文增加了知識合並和教師助理的介紹;在技 術融合的小節,本文增加了知識蒸餾與自動編碼器、 集成學習和聯邦學習的技術融合;在知識蒸餾的應 用進展中,本文分別介紹了知識蒸餾在模型壓縮和 模型增強的應用,並增加了多模態數據和金融證券 的應用進展;在知識蒸餾的研究趨勢展望中,本文 給出了更多的研究趨勢,特別是介紹了模型增強的 應用前景.

總的來說,本文在文獻[3,4]基礎上,以不同的 視角,提供更加全麵的綜述,以便為後續學者了解 或研究知識蒸餾提供參考指導.

本文組織結構如圖 2 所示. 第 2 節回顧了知識 蒸餾的背景知識,包括它的由來;第 3 節解釋知識 蒸餾的作用機製,即為什麼知識蒸餾是有效的;第 4 節歸納知識蒸餾中知識的不同形式;第 5 節詳細 分析了知識蒸餾的各種方法,其強調的是知識遷移 的方式;第 6 節介紹知識蒸餾與其它技術融合的相 關方法;第 7 節歸納知識蒸餾的應用進展;第 8 節 給出了知識蒸餾的研究趨勢展望. 最後,第 9 節對 本文工作進行總結.

2. 知識蒸餾的提出

知識蒸餾與較早提出的並被廣泛應用的一種機 器學習方法的思想較為相似,即遷移學習[7]. 知識蒸 餾與遷移學習都涉及到知識的遷移,然而它們有以 下四點的不同: (1) 數據域不同. 知識蒸餾中的知識通常是在同 一個目標數據集上進行遷移,而遷移學習中的知識 往往是在不同目標的數據集上進行轉移. (2) 網絡結構不同. 知識蒸餾的兩個網絡可以是 同構或者異構的,而遷移學習通常是在單個網絡上 利用其它領域的數據知識. (3) 學習方式不同. 遷移學習使用其它領域的豐 富數據的權重來幫助目標數據的學習,而知識蒸餾 不會直接使用學到的權重. (4) 目的不同. 知識蒸餾通常是訓練一個輕量級 的網絡來逼近複雜網絡的性能,而遷移學習是將已 經學習到相關任務模型的權重來解決目標數據集的 樣本不足問題.

3. 知識蒸餾的作用機製

Hinton 等人[2]認為,學生模型在知識蒸餾的過 程中通過模仿教師模型輸出類間相似性的“暗知識” 來提高泛化能力. 軟目標攜帶著比硬目標更多的泛 化信息來防止學生模型過擬合. 雖然知識蒸餾已經 獲得了廣泛的應用,但是學生模型的性能通常是僅接 近於教師模型. 特別地,給定學生和教師模型相同的 大小卻能夠讓學生模型的性能超越教師模型[12],性 能越差的教師模型反倒教出了更好的學生模型[13]. 為了更好地理解知識蒸餾的作用,一些工作從數學 或實驗上對知識蒸餾的作用機製進行了證明和解 釋. 本文歸納為以下幾類:

(1) 軟目標為學生模型提供正則化約束. 這一 結論最早可以追溯到通過貝葉斯優化來控製網絡超 參數的對比試驗[14],其表明了教師模型的軟目標為 學生模型提供了顯著的正則化. 軟目標正則化的作 用是雙向的,即還能將知識從較弱的教師模型遷移 到能力更強大的學生模型中[15,16]. 一方麵,軟目標 通過標簽平滑訓練提供了正則化[15,16],標簽平滑是 通過避免了過分相信訓練樣本的真實標簽來防止訓 練的過擬合[15]. 另一方麵,軟目標通過置信度懲罰 提供了正則化[12],置信度懲罰讓學生模型獲得更好 的泛化能力,其主要依賴於教師模型對正確預測的 信心. 這兩種正則化的形式已經在數學上得到了證 明. 總的來說,軟目標通過提供標簽平滑和置信度 懲罰來對學生模型施加正則化訓練. 因此,即使沒 有強大的教師模型,學生模型仍然可以通過自己訓 練或手動設計的正則化項得到增強[16].

(2) 軟目標為學生模型提供了“特權信息” (Privileged Information). “特權信息”指教師模型 提供的解釋、評論和比較等信息[17]. 教師模型在訓 練的過程中將軟目標的“暗知識”遷移到學生模型 中,而學生模型在測試的過程中並不能使用“暗知 識”. 從這個角度看,知識蒸餾是通過軟目標來為 學生模型傳遞“特權信息”.

(3) 軟目標引導了學生模型優化的方向. Phuong 等人[18]從模型訓練的角度證明了軟目標能引導學生 模型的優化方向. 同時,Cheng 等人[19]從數學上驗 證了軟目標使學生模型比從原始數據中進行優化學 習具有更高的學習速度和更好的性能.

4 蒸餾的知識形式

原始知識蒸餾(Vanilla Knowledge Distillation)[2] 僅僅是從教師模型輸出的軟目標中學習出輕量級的 學生模型. 然而,當教師模型變得更深時,僅僅學 習軟目標是不夠的. 因此,我們不僅需要獲取教師 模型輸出的知識,還需要學習隱含在教師模型中的 其它知識,比如中間特征知識. 本節總結了可以使 用的知識形式有輸出特征知識、中間特征知識、關 係特征知識和結構特征知識. 知識蒸餾的 4 種知識 形式的關係如圖 5 所示. 從學生解題的角度,這 4 種知識形式可以形象比喻為:輸出特征知識提供了 解題的答案,中間特征知識提供了解題的過程,關 係特征知識提供了解題的方法,結構特征知識則提 供了完整的知識體係.

5 知識蒸餾的方法

本節從知識利用的方式,歸納和分析知識蒸 餾的主要方法,包括知識合並、多教師學習、教 師助理、跨模態蒸餾、相互蒸餾、終身蒸餾以及 自蒸餾.

6 知識蒸餾與其它技術的融合

近幾年,研究人員發現知識蒸餾結合其它主流 技術通常能夠提高其性能. 目前這些主流技術主要 有:生成對抗網絡、神經架構搜索、強化學習、圖 卷積、其它壓縮技術、自動編碼器、集成學習以及 聯邦學習.

7 知識蒸餾的應用進展

知識蒸餾的最初目的是壓縮深度學習網絡模 型,這在資源受限的終端設備上具有廣泛的應用. 但隨著研究的新進展,知識蒸餾不僅可以用於壓縮 模型,還可以通過神經網絡的互學習、自學習等優 化策略和無標簽、跨模態等數據資源對模型的性能 增強也具有顯著的提升效果. 目前知識蒸餾的主要 應用領域有計算機視覺、自然語言處理、語音識別、 推薦係統、信息安全、多模態數據和金融證券. 知 識蒸餾在計算機視覺、自然語言處理、語音識別和 推薦係統上的應用根據其目的的不同,可以分為模 型壓縮和模型增強. 模型壓縮是為了獲得簡單而高 效的網絡模型,以方便部署於資源受限的設備. 而 模型增強通常是利用其它資源(如無標簽或跨模態 的數據)來獲取複雜的高性能網絡.

8 知識蒸餾的研究趨勢展望

知識蒸餾是一個新興的研究領域,它仍有許多 值得深入探索和亟待解決的問題. 在這一節中,我 們提出一些值得進一步深入探討的研究點,也是我 們今後需要解決完善的研究方向.

  • (1) 如何確定何種知識是最佳的。知識蒸餾中 的知識是一個抽象的概念,網絡參數,網絡的輸出 和網絡的中間特征等都可以理解為知識. 但是何種 知識是最佳的,或者哪些知識以互補的方式能成為 最佳的通用知識表示?為了回答這個問題,我們需 要了解每種知識以及不同種類組合知識的作用. 比 如說,基於特征的知識通常用於模仿教師特征產生 的過程,基於關係的知識常用於捕獲不同樣本之間 或網絡層之間特征的關係. 當教師和學生的模型容 量(“代溝”)較小的時候,學生隻模仿教師的軟目 標就可以獲得有競爭力的性能. 而當師生的“代溝” 較大時,需要將多種蒸餾的知識形式和方法結合來 表示教師模型. 雖然能明白多種知識的組合方式通 常能提高學生網絡的性能,但是使用哪些知識形式, 方法和技術的組合是最優的,還尚無定論.

  • (2) 如何確定何處的知識是最佳的。一些工作 隨機選擇中間網絡的某層特征作為知識,比如 FitNets[27]將教師前幾層的網絡特征作為特征蒸餾的 位置. 然而他們都沒有提供一個理由,即為什麼能 夠成為代表性知識. 這主要是由於教師和學生模型 結構的不一致導致的,即教師模型通常比學生模型 擁有更多的網絡層. 因此,需要篩選教師模型中最 具有代表性的特征. 然而教師模型中哪些特征層是 最具有代表性的?這也是一個未解決的問題. 在基 於關係的知識蒸餾中,也一樣無法解釋該選擇哪些 層的關係知識作為學生模仿的對象. 如 FSP 矩陣[31] 隨機選擇教師模型的兩個網絡層作為關係蒸餾的位 置. 關係知識蒸餾是容量無關的,即關係蒸餾僅僅 需要獲取的是網絡層間或樣本間的關係知識. 因此 這不是師生間的“代溝”問題,而是歸咎於知識其實是一個“黑盒”問題.

  • (3) 如何定義最佳的師生結構。知識蒸餾傳遞 的並不是參數,而是抽取到的知識. 因此知識蒸餾 是網絡架構無關的,即任何學生都可以向任何教師 學習. 通常,容量更大的學生模型可以學習更多的 知識,但複雜度過大會延長推理的時間. 容量更大 的教師模型隱含著較多的知識和更強的能力,但是 並非能力越強的教師就能產生更佳的學生模型[13]. 同時,每一個教師模型都有一個最強學生結構[100]. 因此,我們隻能在給定的教師模型的前提下,找到 最佳的學生模型. 然而在未指定教師模型的情況 下,目前還無法確定最佳的學生模型.

  • (4) 如何衡量師生間特征的接近程度。 知識蒸 餾是要將教師網絡中的知識遷移到學生模型中,遷 移效果的好壞最終可以通過學生網絡性能來體現. 然而在網絡訓練的過程中,隻能通過損失函數去判 斷教師和學生之間特征的接近程度. 因此需要提前 設計好知識蒸餾的損失函數,如 KL 散度、均方誤 差(Mean Squared Error,MSE)和餘弦相似性. 而損 失函數的選取受算法和離群點等因素的影響,並且, 不同損失函數的作用範圍是不一樣的. 例如,通過 KL 散度衡量的兩個隨機分布上的相似度是非對稱 的. 餘弦相似性強調兩個向量的特征在方向上的差 異,卻沒有考慮向量大小. MSE 在高維特征中的作 用不明顯,且很容易被隨機特征混淆[4]. 因此,衡量 師生間特征接近程度的方法是多樣化的,我們需要 根據特定的問題和場景選取最合適的損失函數.

  • (5) 蒸餾的知識形式、方法和融合技術還需要 深入探索。 原始知識蒸餾將類間的關係信息作為知 識,但這在“代溝”較大的師生網絡中效果不佳. 為 了解決這一問題,後續的研究者尋找不同形式的“知 識”來充實知識的內涵,如關係知識. 其知識的來 源應該是多樣化的,可以來自於單個或多個的樣本 和網絡本身. 同樣,知識蒸餾的方法和融合技術也 能緩解甚至解決師生間的“代溝”問題,它們強調 充分地利用知識來提高模型的表征能力. 新的知 識形式、方法和融合技術的發現可能會伴隨著新的 應用場景,這將豐富知識蒸餾的理論框架和實踐的 應用.

  • (6) 模型壓縮和模型增強的深度融合. 模型壓 縮是將強大的複雜教師模型中的“知識”遷移到簡 單的學生模型中以滿足低資源設備的應用要求,而 模型增強用於獲取高性能的複雜網絡. 模型壓縮和 模型增強的融合是將教師模型中的“特權信息”遷 移或繼續強化輕量級學生模型的性能. 例如,Liu 等人[206]通過從文本翻譯模型中遷移“特權信息”來改 進輕量級的語音翻譯模型. 在未來的工作中,甚至 能將無標簽或其它領域數據的“特權信息”來繼續 加強一個輕量級學生模型的性能.

  • (7) 知識蒸餾在數據樣本增強上的應用. 深度 學習是數據驅動型的,往往需要大規模的數據集才 能避免過度擬合. 由於隱私和法律等原因,在一些 領域上,通常無法獲取大規模的原始數據集,如醫 療數據. 知識蒸餾需要足夠的數據,才能將教師網 絡中的知識遷移到學生網絡中. 換句話說,數據是 連接教師網絡和學生網絡的橋梁. 先前的研究已經 證明了知識蒸餾在數據樣本增強上的廣闊應用前景, 如通過知識蒸餾產生原始數據集的近似樣本[207]、 使用其它相關數據的知識來減輕對目標數據集的依 賴[208]以及教師和學生間部分網絡的共同訓練來提 高具有小樣本學生網絡的性能[114]. 未來的工作需 要繼續探索知識蒸餾在數據樣本增強上的應用場景 和高效的蒸餾方法來實現小樣本學習(Few-Shot Learning)或零樣本學習(zero-shot learning).

  • (8) 知識蒸餾在數據標簽上的應用. 給數據上 標簽需要特定領域的專業知識、大量的時間和成本. 可以利用知識蒸餾減少標注訓練數據的麻煩,解決 數據標簽的問題. 如果該領域存在著強大的教師網 絡,能通過知識蒸餾給無標簽的數據增加注釋. 具 體地,教師網絡對未標記數據進行預測,並使用它 們的預測信息充當學生模型數據的自動標注[209]. 以無標簽數據作為輸入的教師網絡會產生軟標簽, 這恰好能為學生網絡提供學習的指導信息. 即使該 領域沒有強大的教師網絡,也可以通過跨模態知識 蒸餾,將其它領域的知識充當無標簽數據的監督信 號[66]. 因此,知識蒸餾能夠減少對數據標簽的依賴, 需要繼續研究它在半監督或無監督學習上的應用.

成為VIP會員查看完整內容
50
0

近日,ACM宣布了2021年圖靈獎得主,美國大學田納西大學電氣工程和計算機科學係教授Jack Dongarra,此番獲獎主要源於**其在數值算法和庫方麵的開創性貢獻,正是他的研究使高性能計算軟件在四十多年裏與硬件的指數級改進保持同步。**Dongarra還在橡樹嶺國家實驗室和曼徹斯特大學擔任職務。

這本書的主要目標是讓初學並行計算領域的人更容易理解可用的技術以及如何應用它們。本書旨在為需要理解高性能並行計算的承諾和實踐的學生和技術計算的實踐者。它假設讀者在應用程序或計算科學方麵有良好的背景,但在並行計算方麵沒有。因此,本書包含了大量的教程材料。

成為VIP會員查看完整內容
43
0

深度學習中的泛化神秘在於:為什麼經過梯度下降(GD)訓練的過參數化神經網絡能夠很好地對真實數據集進行泛化,即使它們能夠擬合具有可比性的隨機數據集?此外,在符合訓練數據的所有解決方案中,GD如何找到一個泛化良好的解決方案(當存在這樣一個泛化良好的解決方案時)?

我們認為,這兩個問題的答案都在於訓練過程中不同例子的梯度之間的交互作用。直觀地說,如果每個示例的梯度是良好對齊的,也就是說,如果它們是一致的,那麼可以期望GD(在算法上)是穩定的,因此可以很好地泛化。我們用一個易於計算和解釋的一致性度量來形式化這個論點,並表明對於幾個常見的視覺網絡,度量在真實和隨機數據集上具有非常不同的值。該理論還解釋了深度學習中的一些其他現象,比如為什麼一些例子比其他例子更早被可靠地學習,為什麼早停止有用,為什麼可以從嘈雜的標簽中學習。由於該理論提供了一個因果解釋,解釋了GD如何在存在的情況下找到一個很好的泛化解決方案,它激發了對GD的一係列簡單的修改,減少了記憶,提高了泛化。

在深度學習中,泛化是一個極其廣泛的現象,因此,它需要一個同樣普遍的解釋。最後,我們對解決這一問題的其他途徑進行了綜述,並認為所建議的方法是在此基礎上最可行的方法

成為VIP會員查看完整內容
53
0

來源:“機器學習和數據挖掘”

《CS229:機器學習》是知名深度學習教授吳恩達在斯坦福大學教授的明星課程,課程主要為機器學習及統計模式識別領域的知識進行廣泛地介紹。

課程內容包括:監督學習(生成式/辨別式學習,參數化/非參數化學習,神經網絡,支持向量機);無監督學習(聚類,降維,核方法);學習理論(偏倚/變差間的平衡,VC理論);強化學習自適應控製

課程中還會討論機器學習的近期應用,比如機器人控製、數據挖掘、自動導航、生物信息、語音識別、文本及數據處理。

這份資源是CS229課程涉及知識點的概要總結,作者為Afshine Amidi and Shervine Amidi。提供中文、英文兩個版本

https://github.com/afshinea/stanford-cs-229-machine-learning

資源介紹

**(以下展示均為中文版)**預備知識

** **** **** 代數與微積分**

** 概率與統計**

速查表

** **監督學習

監督學習部分一共有四頁備忘錄,除了一般的線性與 Logistic 回歸,還重點介紹了支持向量機(SVM)、樸素貝葉斯和 K 近鄰等其它一些非參模型。這些基本上都是直接給出的定義,因此不會有過多的冗餘信息,這對於機器學習開發者與研究者作為參考還是非常有幫助的。

具體的其他信息就不做詳細的介紹了,之後大家可以自己看詳細資料。

** 無監督學習**

** 機器學習**

** 深度學習**

成為VIP會員查看完整內容
43
0

【摘 要】

本報告提供了對機器學習 (ML) 技術的基本理解,並回顧了它們在國防和安全領域的應用。其目標是開發ML的內部專業知識,以支持與加拿大皇家海軍(RCN)海上信息戰(MIW)概念和願景相一致的能力發展。本文進行了文獻回顧以收集有關在軍事和民用場景中實施和使用的 ML算法信息。結果表明,海軍必須適應和接受新技術,以便在所有 RCN的數據驅動決策中有效利用所有信息。這可以包括使用自動化、大數據分析、雲計算、人工智能 (AI) 和 ML。這樣做可以減少與繁瑣任務相關的操作工作量,進而最大限度地減少人為錯誤和超負荷。這項研究表明,ML有可能提供新的或增強的能力,以支持 MIW 的概念,以及滿足使用現有和未來信息源的 RCN 的需求。這意味著開發利用這些技術的必要技能將使加拿大武裝部隊(CAF)受益。憑借這些專業知識和這些技術的適當應用,軍方將有能力在必須進行快速數據驅動決策的情況下更有效地利用其信息源。

【對國防和安全的意義】

本報告旨在就如何將人工智能和機器學習技術應用於支持加拿大皇家海軍與海上信息戰相關概念和目標,而建立基本的理解和專業知識。對這些技術及其在國防和安全領域的應用進行了回顧。

1 引言

在過去的十年中,加拿大國防部 (DND) 和加拿大皇家海軍 (RCN) 引入了新的概念和方法,以幫助提升其服務水平。其中許多概念引入了新技術,旨在增強信息空間在作戰級(即作戰職能)和事業級(即管理職能)方麵的防禦能力。在作戰層麵,這些舉措得到了一係列文件的支持,這些文件強調了信息戰的重要性及其在 RCN 內的實施和執行。

2015年,海上信息戰(MIW)的概念被引入[1]。本概念文件概述了在信息環境中運作對 RCN 及其內部可能產生的影響。這一概念的引入清楚地強調了能夠利用該領域中可用信息源的重要性。它討論了信息的影響,基於其廣泛的可用性以及 RCN 的依賴性和使用該信息支持作戰的能力。

采用新的概念和技術進行能力開發並非沒有挑戰。這需要更有效的處理技術來處理在 MIW 的功能區域內收集的大量和各種數據。此外,概念文件還討論了 MIW 與物理、虛擬和認知領域的關係,表明在戰爭中使用所有領域的信息作為 RCN 的寶貴資源的重要性。

2016 年,RCN 發布了一份信息戰戰略文件,重點關注為國家和國際部署開發 MIW 能力 [2]。該戰略文件討論的主題包括有效收集、利用和傳播信息的重要性。該戰略還認識到並傳達了信息戰是RCN可以同時采取防禦和進攻行動的地方。

2017年,加拿大國防政策發布[3]。盡管它沒有直接處理信息領域,但它承認信息對 RCN 的重要性,這在 2019 年和 2020 年分別發布的 DND 數據戰略 [4] 和 RCN 數字海軍 [5] 報告中得到了回應。數字海軍支持國防政策創新目標,其中包括適應和接受新技術的能力,而數據戰略涵蓋了如何利用技術在RCN 社區中做出數據驅動的決策。這可以包括使用自動化、大數據分析、雲計算、人工智能 (AI) 和機器學習 (ML)。在操作上,期望通過這些技術對更繁瑣任務的自動化實施來減少海軍團隊的日常工作量,進而最大限度地減少人為錯誤和疲勞,提高整體作戰效率。

這些文件中包含的首要主題強調了 RCN 采用新的數字能力成為一個信息組織的重要性,其中信息在戰爭環境中被使用,但也被用作工具。使用和利用信息來支持 RCN 的現代工具、技術和專業知識是能力發展的關鍵。在此之後,我們顯然需要一個強大的、知情的、由信息科學、人工智能和機器學習專家組成的科學團體。

這項工作背後的動機是在 MIW 領域內建立科學專業知識,以支持 RCN 的目標。為實現這一目標,以下報告將回顧可在防禦和安全領域中使用的 AI 和 ML 技術。除了這篇綜述之外,本文還將介紹這些與 RCN運作相關的技術的應用,例如艦艇監視、目標檢測以及使用生成建模來支持運作。

這項工作的總體目標是為如何將 AI 和 ML 技術應用於 RCN 挑戰提供科學基礎和理解。建立這些新興技術的專業知識不僅是支持當前運作目標的必要條件,也是對開發和塑造未來能力的投入。這種向算法決策製定的轉變與 MIW 的概念非常吻合,因為它認識到信息在戰爭中的使用至關重要。還提出並討論了 ML 未來的工作和研究主題。

5 機器學習在國防和安全中的應用

2、3、4章節簡要回顧了在計算機科學和數據分析中使用的機器學習技術。這些技術同樣適用於海上防禦和安全領域中經常發現的問題。本節概述這些技術及其在這個領域的應用,特別是海上探測和監視有關的任務。此外,還將討論生成對抗ML方法的應用。需要注意的是,這些部分並不是對這個領域中已經完成的研究的全麵回顧。相反,本文的目的是概述如何使用這些技術改進和開發與RCN相關的新功能。

5.1 艦艇監視

艦艇行為分析是與海上監視和安全相關的關鍵組成部分。這種分析的結果依賴於捕獲和利用艦艇活動數據的能力。用於海上監視的數據源包括:自動識別係統 (AIS) 數據、天基 AIS、雷達數據等。這種監視形式允許分析師進行船隻航跡重建、路徑預測、異常艦艇交通監視,這些在海上領域非常重要,有助於發現恐怖主義、海盜、毒品和武器走私、非法移民和非法捕魚等非法活動。

5.1.1 機器學習應用

各種各樣的機器學習算法和技術可以應用於海事問題並提供有價值的見解。為了支持預測模型的開發,可以使用的技術包括:

• 聚類:無監督聚類方法已用於為海事和艦艇監視提供洞察力。這些聚類算法已應用於 AIS 數據。具體來說,已經報道了基於這些方法對艦艇運動實時預測的可靠性和準確性的研究[25]。還使用應用於基於空間的 AIS21 的 K-means 聚類算法來研究艦艇避撞,以評估航行穩定性和檢測異常行為[26]。研究人員還探索了使用聚類和 AIS 數據流來支持搜索和救援行動[27]。

• 決策樹:使用模糊粗略決策樹算法,研究探索了執行艦艇類型行為學習的能力[28]。對艦艇活動進行可靠和有效的表征可以提高海域態勢感知。這是通過使用包含運動學、靜態和環境信息等軌跡特征的概括向量來實現的,其中軌跡是通過融合 AIS、合成孔徑雷達 (SAR) 和天氣報告來創建的。

• 隨機森林:研究已使用隨機森林算法開發用於艦艇監視和跟蹤的各種目的的模型。由於多種原因,基於 AIS 的艦艇運動往往會丟失數據。例如,這些失誤可能是由於惡劣天氣造成的。為了檢測這些記錄,這些技術已被用於自動識別船隻軌跡中缺失的位置記錄[29]。隨機森林也被用於創建預測船隻目的地的模型。在艦艇離開特定港口後使用曆史 AIS 數據確定目的地點的能力也已被研究 [30]。這也通過比較當前和曆史軌跡數據進行了研究,以便根據相似性度量來預測最終位置[31]。

• 關聯挖掘:創建關聯規則的模型通常用於購物籃分析場景。然而,當應用於 AIS 數據源時,這種算法為艦艇運動分析提供了有用的見解。使用關聯挖掘進行的研究提供了有助於發現艦艇運動模式的洞察力。此類運動包括:軌跡預測,估計艦艇接下來最有可能訪問的港口[32],並在收到新消息時預測艦艇的位置,並計算有和沒有艦艇位置插值的關聯概率[33]。

• 支持向量機:支持向量機執行回歸和分類任務。支持向量回歸用於研究異常艦艇行為的檢測。當前檢測異常行為的方法是利用艦艇運動的突然變化。然而,與海上事故相關的導航數據可以模擬正常情況。為了解決這個問題,使用 SVR 航道模型及其路線提取方法,開發了一個模型來檢測異常艦艇行為 [34]。該研究的目的是定義“通過將導航數據分配給位置基礎來確定異常行為的可接受的最大值和最小值”[34]。除了SVR研究之外,科學家們還研究了SVM在檢測和分類異常艦艇行為方麵的應用。通過從原始AIS數據中提取海上運動模式,對異常艦艇行為的識別和分類提供了新的信息[35]。

• 人工神經網絡:人工神經網絡 (ANN) 已被用於幫助預測北極的船隻速度,因為該地理區域氣候變化帶來的交通量增加[36]。 AIS 數據的使用允許模型根據位置、時間、艦艇用途、大小和冰級來預測艦艇的速度。在[37]中,作者使用神經網絡作為一個基於雲的web應用程序來預測未來的艦艇行為。它能夠將預測的短期和長期行為疊加到交互式地圖上。除了預測艦艇航線,人工神經網絡也被用於調查異常檢測事件。具體來說,該研究著眼於AIS轉發器中觀察到的有意和非有意的切換,因為這種活動可以用來隱藏可疑或非法活動[38]。

•卷積神經網絡:AIS、雷達、高精度攝像機和電子海圖等信息源為理解海上態勢感知提供了有用的信息。利用這些來源,CNN可以提取艦艇運動模式。在[39]中,作者通過將原始AIS數據轉換成保存艦艇運動模式信息的圖像數據結構,利用曆史AIS重建艦艇軌跡。然而,使用AIS係統的艦艇軌跡重建技術存在原始數據含有噪聲、記錄缺失和其他錯誤。許多研究在進行彎曲軌跡或高損失率的艦艇重建時麵臨困難。為了克服這些障礙,[40]的作者使用了一種健壯的CNN架構,稱為“U-net”。這種架構能夠處理不同采樣率的軌跡、丟失的數據記錄和其他噪聲相關問題的軌跡。

• 循環神經網絡:艦艇監測通常依賴於存在許多問題的 AIS 數據。AIS源可以表示大量數據,除了具有不規則的時間戳和丟失的記錄外,這些數據有時可能會非常髒亂。已經進行了研究以幫助解決這些問題。研究 [41] 使用多任務深度學習框架,將 RNN 與潛在變量建模相結合,以幫助在執行軌跡重建、異常檢測和艦艇識別等任務時處理這些問題。 [29]中的作者利用隨機森林來識別丟失的記錄,並使用 LSTM 架構來重建缺少 AIS 記錄的船隻軌跡。結合統計分析、數據挖掘和神經網絡方法監測內河艦艇數據[42]。具體來說,LSTM 用於艦艇軌跡修複、發動機轉速建模和燃料消耗預測。在另一項研究 [43]中,由於與設備故障、傳輸延遲和信號丟失有關的問題,需要在分析之前對 AIS 數據進行預處理。作者通過將 LSTM 與變量建模相結合來執行軌跡重建,同時考慮異常軌跡數據和艦艇航行狀態。這一努力將有助於減少艦艇碰撞的風險,並支持其他研究途徑,如艦艇類型分析、風險評估、軌跡預測和航線規劃。

5.1.2 對比分析:為確定艦艇類型而開發的機器學習模型

監視海域中的艦艇行為對於檢測可能表明存在非法活動的異常情況至關重要。收發器用於報告 AIS 數據流,其中包含有關船隻及其軌跡的信息。由於從 AIS 數據流收集的信息是自我報告的,因此可能會出現問題。有意或無意地修改此數據或打開/關閉轉發器會導致間歇性消息,這些消息可能不準確或具有誤導性。這種策略可用於掩飾海上的非法行為和活動。

在某一天,有大量船隻在海上作業,人類操作員無法監控和檢測這些事件。因此,可以使用 AIS 數據流以及其他來源來訓練 ML 模型,從而為人類操作員提供自動化支持和洞察力。根據行為特征確定船隻類型的能力是 ML 提供的眾多能力之一。探索艦艇類型分類的兩項研究是[28]和[44]。

在[28]中,作者開發了一個模糊粗略的決策樹模型,以根據運動學、靜態和環境信息確定艦艇類型。用於模型開發的訓練數據包含來自加拿大東海岸和美國東北部的 AIS 消息。[44]中給出的結果使用具有來自兩個不同地理區域的軌跡信息的 GANN 執行艦艇分類。第一個是歐洲數據集,其中包括來自凱爾特海、海峽和比斯開灣的海上交通。另一個是東南亞數據集,根據在新加坡附近的海峽和港口以及南中國海開放水域的海上交通中船隻的預期運動模式,該數據集被分為三組。

在[44]中,作者使用以下性能指標來評估他們的模型:召回率、精度和 F1分數[45]。作者在他們的報告中使用召回指標作為他們的模型準確性。召回率表示正確識別的實際相似性部分,其中準確度是正確預測的數量與預測總數的比率。假設作者使用召回作為準確率,當將其與[28]中報告的性能進行比較時,此分析將把[44]中的召回指標視為模型準確度。兩項研究都將他們的結果與一係列其他 ML 技術進行了比較,以幫助評估性能。然而,與[44]不同的是,[28]報告了具有不確定性的準確性,從而賦予了性能結果意義,並使模糊粗略決策樹模型與其他標準技術相比更容易理解。除此之外,比較這兩篇論文的結果(沒有不確定性測量)表明,大多數機器學習模型的表現都一樣好。例如,k-最近鄰、樸素貝葉斯、隨機森林和支持向量機在[28]中的性能準確度在[44]中使用的四個數據集中的兩個數據集中的相似鄰域內。具體而言,新加坡港口和海峽周圍海上交通的準確率報告在 47% 到 64% 之間,而[28]中報告的準確率為 45% 到 69%。

[28] 中使用的多層感知器取得的結果表明,它以81.5%的整體準確度優於其他模型,略高於模糊粗略決策樹結果 (80.7%)。[44]中報告的四個不同數據集的準確率在41%到56%之間,非常差。在 [28] 中,對各種參數進行了特征選擇過程,並根據分配的加權值選擇了19個特征中的 10 個。特征及其相關權重為:ship_length (1.0)、avg_speed (0.183)、max_speed (0.183)、speed_st_dev (0.183)、course_st_dev (0.100)、heading_st_dev (0.097)、duration (0.082)、end_point lat (0.055)、start_point_lat (0.052) 和 max_lat (0.051)。[44]中使用軌跡特征來執行分類,利用 AIS 消息中包含的時間戳、經度、緯度、對地航向和對地速度。

這些研究之間選擇用於訓練的特征之間的主要區別之一是[28]中權重和影響最大的特征是ship_length,這不是[44]中使用的特征。模型的成功很大程度上取決於所用數據的質量和數量,但在很大程度上取決於特征選擇。在多層感知器模型的情況下,[44]中使用的軌跡信息特征可能不足以生成準確的艦艇類型預測。這表明了解艦艇的長度是進行此類分類的關鍵指標。在比較[28]中選擇的特征時,ship_length 被分配的權重大約是任何其他特征的五倍。這將使模型在進行分類時更加依賴此特定信息。除了特征選擇和可調超參數外,使用的訓練數據也對模型的成功有影響。數據的特征,如記錄數量、代表性內容以避免過度/不足以及數據完整性,都在成功訓練模型以提供高度性能方麵發揮作用。

另一個有趣的觀察結果是,[44]中使用的GANN 報告了其分析中使用的數據集從低 80% 到高 96% 的一係列準確度,平均準確度為 87%。這些結果優於 [28]中使用模糊粗略決策樹報告的80.7% 準確度。關於為什麼GANN 的表現似乎更好,有一些可能的解釋。GANN模型基於LSTM-RNN,它允許將時間依賴性構建到模型中。包括這個額外的時間維度可以提供預測洞察力,從而實現更高程度的預測準確性。此外,GANN 模型使用對抗性組件進行訓練,該對抗性組件可能迫使網絡實現更大程度的學習以執行其所需任務。

5.2 目標檢測

目標檢測對於防禦和安全的海上環境中的監視和態勢感知都至關重要。然而,這是一項艱巨的任務,因為尺寸、方向和目標配置的變化加上環境背景噪聲和使用的各種傳感器的性能差異很大。所有這些事情隻會增加這個問題的整體複雜性。傳統的檢測算法缺乏簡單性和可靠的輸出。深度學習領域的最新研究和進展表明,CNN 可以執行與檢測相關的任務,同時提供高速性能和準確性。開發這些能力正在推動促進防禦和安全的技術。

5.2.1 機器學習應用

目前使用 CNN 顯示出前景的能力包括:使用SAR圖像進行艦艇識別和分類以監測海洋區域[46][47]、使用探地雷達[48]進行魚類檢測、海冰SAR圖像分類以監測極地地區的變化並檢測可能威脅海上交通的流冰[49],並檢測從SAR [50][51] 和遠程傳感器[52]獲得的圖像中的船隻。雖然這不是一個詳盡的應用程序列表,但它確實突出了一些與信息戰領域相關的當前 ML 應用程序。特別是,現在將討論 CNN 的兩個有趣的應用。

• 水下聲納圖像的目標識別和分類:研究[53]的研究重點是深度學習特征提取在水下聲納圖像目標識別和分類中的應用。該方法通過 CNN 使用聲納圖像提取目標特征。然後使用 SVM 進行分類。在現代海上作業期間執行自動目標識別和分類可以幫助當局檢測潛在威脅。自主係統,例如基於調查和戰術信息收集圖像的無人水下航行器,是可以利用這種技術的係統。機器學習的這種應用減少了對具有分類目標專業知識的操作員的需求。因此,隨著效率、速度和成本的提高,這個過程有可能變得更加自動化。該領域的一個活躍研究課題包括使用 ML 更好地檢測聲納數據中的類似地雷的物體[54][55]。

• 使用有限數據進行軍事目標識別和分類:CNN等深度學習算法是用於處理圖像和視頻的強大工具,可支持防禦和安全功能。目標識別和分類能力對於監視和態勢感知至關重要。然而,所開發模型的成功取決於能否獲得反映被建模數據的關鍵屬性和特征的良好數據集。許多軍事場景中的訓練數據集的大小可能很少。[56]中的作者使用遷移學習和混合神經網絡層的組合來解決這個問題,以開發可以嵌入的先驗知識,以實現對高精度識別任務的特征提取的改進。這樣的發展自然會進入並改進分類過程。

5.2.2 對比分析:為使用聲納圖像進行目標檢測而開發的機器學習模型

自動目標識別在海上作業中發揮著重要作用。無人水下航行器使用聲學傳感器產生聲納圖像,幫助檢測水下目標和威脅,例如水雷。由於噪聲、低對比度和低分辨率,使用聲納圖像進行目標檢測很困難。ML和DL都提供了可以幫助提取特征和重要信息以進行對象檢測和分類的功能。

探討這個問題的兩篇研究論文包括Zhu等人[53]和Bouzerdoum等人[57]的工作。在[53]中,作者使用稱為AlexNet的預訓練NN來執行特征提取,然後使用SVM將檢測到的對象分為兩類:目標和非目標。然後將性能與以下兩種技術進行比較:局部二進製模式和定向梯度直方圖。在[57]中,作者遵循與[53]類似的方法,其中使用預訓練的網絡進行特征提取,並使用 SVM 對檢測到的對象進行分類。然而,在[57]中,對象被分為三個不同的類別:類水雷對象、非類水雷對象和誤報對象。該研究還開發了一個用於分類目的的小型 CNN,並使用了一個名為 ObjectNet23 的預先開發的 CNN 來執行相同的任務。所有這三種方法都在它們的整體性能方麵進行了比較。

兩項研究都測試了用於特征提取的預訓練 CNN 和用於分類的 SVM 的應用。結果表明,[53]和[57]的性能準確率分別為 95.9% 和 76.2%。鑒於這些方法相似,人們不會期望這些結果會有大約 20% 的差異。兩個係統都使用預訓練的網絡進行特征提取。有趣的是,[57]考慮了不同的 CNN 架構,包括 VGG16 和 VGG19。這些網絡是基於 AlexNet 網絡的架構構建的,但經過改進。

奇怪的是,[57]中使用VGG的方法不會勝過[53]中使用 AlexNet 的技術。這樣的結果可以用許多因素來解釋。作者沒有指定用於訓練VGG網絡的數據集。用於訓練的數據質量和數量可能會影響模型的性能,從而使 AlexNet 能夠更好地提取特征。該問題也可能存在於SVM執行的分類中。用於訓練這些係統的數據可以極大地影響預測結果,因為在該領域很難獲得大量標記數據。兩項研究都進行了數據處理並使用增強技術來增加數據集的大小,這不如擁有更多“真實”數據點有效。此外,應注意分類類別的差異。[53]和[57]中檢測到的對象分別分為兩類和三類。擁有額外的類並嚐試檢測特定對象會更加複雜,並且可能會降低這些模型的整體性能準確性。

盡管這些研究使用了類似的方法來實現預訓練的 CNN 和 SVM 來執行目標檢測,但[57]也為此任務開發了一個小型 CNN。小型 CNN 的性能優於預訓練的 CNN + SVM 模型,準確率達到 98.3%。與大型 CNN 不同,較小尺寸的 CNN 需要訓練的參數顯著減少,從而在數據樣本有限時減少過度擬合的機會。這可能是小型 CNN 和預訓練 CNN 之間顯著性能差異的原因+ SVM 模型。

5.3 生成對抗網絡應用

艦艇檢測在軍用和民用環境中發揮著重要作用,各種類型的成像傳感器用於檢測、跟蹤和分類艦艇。因此,DNN 的引入改變了軍隊執行任務的方式。生成網絡提供了生成代表曆史數據記錄的數據或樣本的能力。此功能提供了新的數據樣本,可用於在軍事場景中訓練智能係統,在這些場景中,由於可用性、安全分類和成本,數據通常難以收集。但是,其他國家也可以使用相同的過程來創建對抗性數據,這些數據有可能危及易受此類攻擊的國家係統。因此,GANN 的實現既可以用於進攻性場景,也可以用於防禦性場景。這些網絡可用於訓練預測、分類和產生可靠輸出的智能係統,以發展未來的軍事能力。 GANN 還提供了執行對抗性攻擊以欺騙對手係統的能力。

5.3.1 機器學習應用

GANN與國防和安全領域相關的應用包括:

• 對抗性偽裝:偽裝在軍隊中被用作一種策略,以阻止對手在視覺上檢測和分類軍事物體的能力。此類任務傳統上由人類觀察者執行。然而,戰鬥空間在不斷發展,自主軍事代理和人工智能在此類任務中的使用也在增加。這一變化促使科學家們研究偽裝是否能有效對抗這些聰明的對手,或者是否有可能設計出能夠迷惑這些人工智能對手的偽裝。2019 年,對這個問題進行了調查,其中NN被訓練來區分和適當分類軍用和民用船隻 [58]。這項研究的結果表明,如果 GANN 生成的模式覆蓋在軍艦的某些部分上,則針對此類圖像分類訓練的 NN 可能會混淆這些模式。這種技術被稱為對抗偽裝。進一步的研究 [59]研究了如何使用這種方法來欺騙選擇的幾個NN分類器。通過這樣做,他們能夠將分類的整體準確性降低到被認為不可靠的程度。在研究 [60]中,研究了迷彩圖案的穩健性和通用性。這些模式在研究中被稱為補丁,並且發現通過在補丁生成器的訓練中實施降級過濾器,作者表明他們能夠提高這些補丁的整體魯棒性或有效性。

• 特定發射器識別:[62]中報告了使用GANN開發的半監督特定發射器識別 (SEI)應用程序。此應用程序是針對與基於接收到的波形對發射器進行 SEI 分類相關的問題而開發的。這些波形容易受到可能導致單個發射器表示不準確的因素的影響。SEI在包括無線電和無線網絡安全在內的各種軍事應用中都很重要。

• 時空數據:2020 年,報告了與時空數據一起使用的 GANN 架構以及衡量此類模型性能的常用評估方法 [63]。這些架構已被用於執行軌跡預測和時間序列。盡管在該領域正在進行重要的研究,但執行時空數據預測的能力對研究人員來說是一個持續的挑戰。特別是對於時空應用是一個新領域的GANN。[63]中討論的最近工作強調了與數據生成相關的問題,這些問題會影響研究人員理解數據特征的能力。

5.3.2 對比分析:針對對抗偽裝開發的機器學習模型

對抗性偽裝用於防止軍事資產被發現和分類。傳統上,偽裝是通過使用大網或油漆來幫助隱藏人類觀察者的飛機或船隻等資產來實現的。然而,隨著使用智能係統執行傳統上由人類執行的分類任務,戰場空間發生了變化。Adhikari等人[64] 和Aurdal 等人[58]進行的兩項研究,如何使用對抗偽裝來欺騙或誤導這些智能係統執行的自動對象檢測。在[64]中,基於補丁的對抗性攻擊被用來掩飾軍事資產不受無人駕駛空中監視的影響。該研究使用神經網絡創建覆蓋在軍事資產上的各種補丁,以防止自動檢測目標物體。對於這些研究,感興趣的目標對象主要是飛機。[58]中進行的工作訓練了一個可以檢測和分類軍用和民用船隻的 NN。對第二個網絡進行了訓練,以生成用於防止對軍艦進行檢測和分類的補丁。

這些研究使用對抗性補丁來防止智能係統檢測或錯誤分類資產。兩項研究都表明,對抗性偽裝既可行又有效,但在現實世界中並不可行。貼片的設計可能相當複雜,因此很難將其複製到飛機或船隻的外部。與[58]不同,[64]確實試圖通過將現實世界的適用性構建到損失函數中來解決這個問題。然而,這種方法是否充分並不明顯。

在比較這些作者所采取的方法時,[64] 中防止檢測的目標似乎更可行,部分原因是避免了與國際人道主義法相關的問題。相比之下,作者在 [58] 中的意圖是使用對抗性偽裝來實現將軍用船隻錯誤分類為民用,顯然會陷入法律戰爭問題。然而,[64] 中采用的方法對於 [58] 中的船隻可能更複雜,因為它們沒有與部署在陸地上的軍事資產相同的多樣化環境。這表明在考慮對抗性偽裝的應用時,能夠避免檢測是兩種方法中更好的方法。

此外,[58] 中使用的數據集由世界各地用戶上傳的圖像組成,這些圖像主要由艦艇輪廓組成。該數據集不太可能包含每艘船的足夠的方麵數據。此外,[64] 專注於航拍圖像,而 [58] 則沒有。在海上的任何軍事場景中,用於檢測船隻的數據集很可能包含空中數據。擁有完整的數據集將允許模型為這些艦艇的不同方向生成補丁,而不僅僅是輪廓補丁。為實際使用實施對抗性偽裝不僅需要此類數據,還需要適當的技術來實施。

最後,[64] 的訓練數據顯著減少,它使用稱為 YOLO26 的標準預訓練網絡進行目標檢測。該網絡是對語義對象進行分類的通用模型,並未經過專門訓練以檢測空中目標。然而,在[58]中建立並訓練了一個鑒別器網絡來專門檢測和分類艦艇。使用這種專門的鑒別器網絡的目的是提高創建補丁的網絡的整體性能。如果[64]的作者使用專門的鑒別器網絡而不是他們的預訓練網絡,他們將獲得什麼性能提升,這將是一件有趣的事情。

6 總結和未來工作

技術進步已經並將繼續改變與現代戰爭相關的所有戰場空間。隨著機器學習、人工智能和自主代理的引入,軍方必須學會調整這些不斷發展的技術並將其整合到他們的係統中。DND和RCN都已主動引入和使用此類技術,目的是提高整體防禦和安全性。本節將總結本文的內容,並討論作為文獻回顧的結果將進行的未來工作。

6.1 總結

本報告探討了深度學習和機器學習技術,這些技術可用於開發流程以支持 RCN 實現其既定目標所需的自動化和高效率。例如,回歸是一種進行未來預測的簡單方法,無監督聚類方法通過檢查和分組具有相似特征的數據點來推斷新信息,決策樹和隨機森林允許分析師評估選項並根據準確度估計進行分類,關聯挖掘創建可以檢測行為和模式的規則集,支持向量機允許分析師根據多種核函數選擇在高維空間中進行有效的預測和分類。此外,神經網絡很重要,因為它們可用於開發支持自動化的工具。例如,感知和深度神經網絡提供了人類不容易執行的分析能力;卷積神經網絡可以輕鬆處理具有網格狀拓撲結構的數據,例如音頻信號、圖像和視頻;遞歸神經網絡可以處理序列數據並處理長期依賴關係;生成建模技術可以執行密度估計和樣本生成,以支持一般的訓練模型或支持防禦和進攻行動。

這些學習算法和技術的應用為分析師提供了洞察力並簡化了繁重的任務。在國防和安全的背景下,它們在能力開發周期中的應用顯示出巨大的前景。具體而言,本報告重點介紹了三種此類應用,包括艦艇監視、目標檢測以及對防禦和進攻行動的支持。相當多的機器學習重點是艦艇監控,特別是航跡重建、防撞、航跡預測、目的地預測等。該研究領域已經研究並報告了許多機器學習算法的應用。目標檢測對於海上環境中的監視和態勢感知都至關重要。用於物體檢測的卷積神經網絡已被用於對船隻進行分類、發現水雷、檢測海冰、使用水下聲納圖像進行分類、檢測具有有限數據的軍事物體等。生成對抗神經網絡可用作支持密集操作的工具和防守。此外,在國防和安全領域,它們已用於樣本生成、生成對抗偽裝、用於支持特定發射器識別,並用於時空數據應用,包括軌跡預測和時間序列插補的事件生成。

這些技術在國防和安全領域的適當應用可以為軍方提供情報,這些情報可以在必須進行快速數據驅動決策的情況下加以利用。本文提供了對 ML 技術應用背後的基礎知識的基本理解,以幫助構建使用符合 RCN 既定目標的新技術支持和構建能力所需的內部專業知識。對發展這種專業知識的任何投資都將有助於塑造應對現代戰場所帶來的挑戰所需的未來能力。這些空間在本質上變得越來越技術化,因此,DND 和 RCN 必須學習如何適應和改變,以便在這些環境中發揮作用。對於 RCN,利用技術援助利用數據和信息對於海上信息戰概念的成功至關重要。

6.2 未來工作

第 5 節中的討論涉及與 MIW 相關的防禦和安全領域的各種 ML 應用。當前研究的一個共同主題是對艦艇監視的內在興趣。雖然 AIS 數據流是用於高度研究主題的重要信息來源,包括軌跡重建、路徑預測和船隻異常行為識別,但文獻缺乏檢測與數據流本身相關的潛在異常。

在研究艦艇監視領域的異常檢測時,文獻傾向於將“異常”稱為可用於掩蓋非法海上活動的 AIS 應答器的有意和非有意開關。然而,研究這個數據流的特征和這個信息源中可能存在的異常是很重要的。檢測和解釋數據流中的異常有助於建立用戶對使用此信息訓練的 ML 模型的信任。模型提供準確和穩健的預測或分類的能力源於使用可靠和值得信賴的數據。因此,有必要將研究工作集中在 AIS 轉發器數據流上。

AIS數據流為各種船舶提供了大量的數據,這些船舶被法律要求在海上發送AIS信息。但是,船舶並不是操作可以產生AIS信息的AIS技術的必要條件。因此,用戶如何相信他們收到的數據是可靠、準確的,並且來自實際船隻?這方麵的一個例子是虛擬艦艇的存在。在這種情況下,這些船隻正在將 AIS 消息傳輸到數據流中,即使它們實際上並不存在。這種類型的惡意注入可以用來迷惑和影響情報人員和決策者。這些虛擬船隻的存在是海事運營中心注意到的數據流中的異常現象。因此,它們需要被識別和解釋,以支持決策過程。

在異常行為的背景下,研究虛擬艦艇的檢測是本研究中同樣重要的課題。這些研究將探索第 3 節和第 4 節中討論的機器學習技術的應用。檢測和確定識別虛擬艦艇的關鍵 AIS 信號特征的能力是這項工作的基礎。此外,從 AIS 數據流中刪除惡意注入的能力將大大有助於使信息更加可靠、準確和值得信賴。

成為VIP會員查看完整內容
中文版——加拿大國防研究與發展中心《機器學習技術及其在國防和安全中的應用》.pdf
51
0
Top
微信掃碼谘詢專知VIP會員