本報告由來自美國陸軍研究實驗室、美國國防情報局、美國國家地理空間情報局(NGA)、英國國防部國防科學技術實驗室(Dstl)、加拿大國防研究與發展部、德國弗勞恩霍夫FKIE研究所等多個單位聯合撰寫。介紹了北約信息係統技術(IST)探索小組111(ET-111)的調查結果。成立ET-111是為了在北約各國之間分享對知識表示和推理(KRR)現狀的理解,以了解技術現狀並考慮未來的合作活動是否有益。
為了支持高水平的數據融合,當下有一個基礎性的需求,即信息和知識要能被人類和機器理解。知識表示是將知識以計算機可操作的形式表達出來,以便對其進行利用。這樣做的一個關鍵原因是,知識可以被推理。基於知識的係統也可能被稱為符號人工智能和基於規則的人工智能,並且在過去50多年裏一直是一個活躍的研究領域。因此,它可能被一些人認為是 "老派 "的人工智能,與近年來日益突出的基於算法和機器學習的人工智能方法不同(眾所周知,後者存在可解釋性和概括性問題)。在 "大數據 "時代,知識表示和推理為利用靈活、可解釋和基於人類知識的數據提供了一個途徑。
這篇綜述的第一個目的是為知識表示和推理領域提供一個技術介紹。為讀者提供關鍵概念的知識--以培養理解力--將使人們能夠欣賞到知識係統的能力。第二個目的是通過實例,提供對創建知識係統過程的掌握,以及如何在軍事背景下使用這種係統來解決現實世界問題。對知識係統最適用的現實世界問題的理解,有助於成功實施KRR並將其與北約係統和理論相結合。
在這份報告中,我們首先討論了北約成員國麵臨的一些挑戰,以及北約的知識表示和推理可能會對這些領域產生的影響。然後,我們對知識表示、知識工程和推理方法的技術方麵做了一個總結。我們討論了知識表示的具體例子,如MIP信息模型(MIM)、富事件本體(REO)、OPIS和國防情報核心本體(DICO)。我們還描述了WISDOM研發平台和智能態勢感知(INSANE)框架,作為使用知識表示來支持感知的例子。
隨後,我們回顧了更廣泛的研究,包括文本分析如何支持從報告和其他來源的文本中提取知識,關於因果關係的工作以及推理係統中的可解釋性和信任問題。
最後,我們總結了報告的結論和對北約聯盟的影響,提出了進一步工作的主要建議:
建議1--北約科技組織應讚助一項技術活動,以展示符號和亞符號方法的互補使用及其對改善決策的益處。
建議2--北約科技組織應讚助一個虛擬係列講座/研討會,以提高北約科學和業務部門對KRR技術的認識,從而為該領域的進一步技能發展提供催化作用。
建議3--北約科技組織應讚助一個專門的探索小組,考慮因果模型的具體興趣,以及它在基於知識的係統中的應用,作為未來在諸如建議1活動下進行實際演示的先導。
隨著傳感器、性能、反饋和其他數據數量的不斷增加,國防麵臨的最緊迫的挑戰之一是可靠地、快速地篩選、融合最相關的觀察和信息並采取作戰行動的能力。信息的重要性體現在北約的所有戰略重點中[2]。俄羅斯對歐洲-大西洋安全的威脅是基於旨在破壞戰略關係(如歐盟、北約等)的虛假信息;打擊一切形式和表現的恐怖主義,現在的前提是能夠將機密和公開來源的材料聯係起來,以確定可以采取行動的聯係和行為;網絡威脅主要是在信息空間進行的。
北約對聯盟地麵監視(AGS)係統的收購代表了北約在支持其未來行動中提供豐富數據饋送的能力的重大提升[3]。但是,在英國的 "信息優勢 "等概念中,人們認識到,現在隻有通過及時和有效地融合這些數據饋送,才能實現真正的優勢。
當然,處理信息過載的挑戰並不限於國防領域。金融、廣告和工程等領域,都在抓住機遇,改善決策,瞄準服務,提高新解決方案的交付速度。近年來,應用機器學習(ML)方法應對這些挑戰的潛力已經引起了公眾、投資者和世界各地高層領導人的注意。因此,這樣的ML方法正在展示其應對防禦挑戰的潛力,包括圖像和視頻資料中的物體檢測和標記、提取實體和關係的文本分析以及語音檢測和翻譯。在計算能力、數據可用性和計算框架的重大突破基礎上,對數據和人工智能的興趣將大大增加。
因此,防禦能力將越來越能夠處理最關鍵的信息流,節省分析員的時間,提高他們快速發展和保持態勢感知的能力。然而,由於人類分析員的注意力也被持續競爭時期的操作和作戰活動所牽製[5],仍然需要不斷提高他們在多個領域連接細微但重要的觀察的能力。例如,隨著作戰尋求常規的全頻譜效應,物理、社會和網絡領域之間觀察的相互聯係將越來越重要,但如果沒有其他能力支持,這種聯係可能不容易被發現。重要的是,將這些觀察結果與過去的知識、相關人員的固有專長以及之前的經驗聯係起來是至關重要的。
複雜性一直存在於自然和生物領域中。然而,隨著科學和技術的進步,人類現在有能力製造出其複雜性接近生命本身的人工製品。有必要使用先進的方法來處理這種複雜性。
這種複雜性源於數據的速度、密度和空間範圍的巨大增長,以及不斷增加的各種元素之間的耦合,其中一些是自然的,而許多是合成的。防禦的一個核心挑戰是應對複雜情況的方法。我們麵臨著技術的快速發展,提供了更多的數據、信息和能力,同時也麵臨著具有挑戰性的地形,如城市環境和涉及叛亂分子、混合人口、非政府組織的 "人類地形"。這些複雜的情況實際上比以往任何時候都更需要及時的決策來戰勝威脅,而決策的質量將始終與對情況的理解程度密切相關。這種理解力受到如此快速的行動和技術變化的挑戰,需要新的方法來更好、更快地分解複雜的情況。雖然人類的思維方式仍然深深紮根於經典的還原論概念,即通過將問題分解為子問題來解決,但現在人們認識到,以有效的方式接近複雜性不能脫離還原論方法。
諸如英國的 "信息優勢"[6]等國家概念試圖催化信息在國防行動中的作用,強調必須進行創新,否則就有可能 "枯萎"並跟不上對手的步伐。美國的 "用機器增強情報"(AIM)倡議[7]也提供了一個戰略觀點,強調了AI和ML在未來情報能力中的作用。對於IST-ET-111來說,AIM倡議特別強調了代表知識方麵的基礎研究進展。
多年來,JDL融合模型[8]對實現低層和高層數據融合的技術挑戰進行了很好的定義。然而,全麵的解決方案,特別是高層的數據融合,仍然缺乏,而且是不斷研究和開發的主題。
信息融合的挑戰幾乎延伸到國防的所有方麵,從後勤到人員管理、平台維護和醫療。然而,在北約背景下,重點是聯盟行動,如在阿富汗的行動,考慮實現態勢感知以支持指揮與控製(C2)和情報功能的挑戰也許是最貼切的。這些活動的特點是需要:
C2和情報活動產出的主要作者和消費者是人類分析員和作戰人員,但隨著北約部隊更多地使用自動化和自主係統,機器在支持、增強和利用基礎態勢感知和高層融合活動中的作用將越來越重要,需要考慮。
為了支持這種高層的融合,現在有一個基本的需求,即信息和知識要能被人類和機器理解。通過這樣做,就有可能應用機器推理(推測)方法,將規則和形式邏輯應用於現有數據,以提供更高層次的推理。知識表示是將知識以計算機可操作的形式表達出來,以便對其進行利用。這樣做的一個關鍵但不是唯一的原因是,知識可以被推理。基於知識的係統也被稱為符號人工智能和基於規則的人工智能,並且在過去五十多年裏一直是一個活躍的研究領域。
知識表示和對這些知識進行推理的願望是北約七個新興和顛覆性技術(EDTs)中三個的核心:數據、人工智能和自主性,其中每一個都重疊並支持另一個[9]。
當然,正是最近對 "機器學習"(也被稱為亞符號)方法的興趣,專注於神經網絡等計算方法,一直處於公眾對人工智能敘述的最前沿,經常看到ML和AI這兩個術語被交替使用。這類係統已經在多種應用中證明了其價值,如產品推薦係統、交通模式的預測和貸款審批。使用ML來支持基於內容的多種數據類型(圖像、視頻、文本和社交媒體)的分析是現已完成的IST-RTG-144(多內容分析)的核心興趣。該小組清楚地展示了對單模態進行分析的潛力,以及在更廣泛的情報周期內結合這些分析的機會,但它沒有考慮自動/半自動融合或針對觀察結果進行推理,以支持高水平融合的目標。
ML方法通常利用大量的數據來開發模型,將輸出與輸入聯係起來。對於某些類別的任務,如圖像標記,ML是一種行之有效的應用,但即使是人工智能係統的領導者也很謹慎,甚至對它的成功持批評態度[10]。用ML方法表示和包含知識(所謂的神經符號方法)可能是提高未來解決方案的穩健性和性能的一個潛在步驟。
因此,實現這一目標的基本步驟是建立有效的知識表示(符號表示),可以被未來的混合係統所使用。符號方法可能更善於處理稀疏的數據,支持增強的可解釋性並納入過去的人類知識,並使用擅長模式識別和數據聚類/分類問題的計算方法。然而,如果這些方法/技術要支持未來的聯盟行動,就需要聯合起來努力。這包括
開發特定領域的本體論(為特定領域定義的詞彙表)。
部署和評估推理能力。
為事件驅動的處理建立有效的架構。
處理觀測中的不確定性和模糊性。
信息共享和觀測數據來源。
聯合部署和應對規模問題的方法。
正是在這種情況下,北約IST-ET-111 "知識表示和推理 "被提出來,目的是彙集北約夥伴對KRR現狀的理解,以了解技術現狀並考慮未來是否需要開展活動。
通過建立技術現狀和北約國家的技術能力,IST-ET-111團隊希望這份報告能夠支持圍繞實現有效的人機團隊的最有效方法進行對話。探索小組的建立也是確定如何利用其他北約國家的科學和技術活動來獲得近期和長期的業務利益的一個步驟。
最終,我們預計KRR的有效使用會帶來以下結果:
本報告針對的是更廣泛的北約STO社區和國家代表,他們
可能需要領導技術變革舉措,並可能從在軍事背景下使用KRR方法和手段中受益。
需要實施新的解決方案以更好地利用信息和知識;
可能擁有ML方麵的專業知識,並正在尋求其他方法來提高結果的穩健性和可解釋性。
首先,本報告關注知識表示的核心概念(第2章),認識到利用基於知識的方法的第一步是擁有表示知識的手段,然後才是對知識進行推理的方法,或者換句話說,從我們已經知道的知識中推導出新知識的方法。然後,報告轉向實施KRR方法的問題(第3章),用具體的例子來說明其中的問題。最後,對活躍的研究主題進行了簡短的討論(第4章),並提出結論和建議(第5章)。