知識圖譜(Knowledge Graph),在圖書情報界稱為知識域可視化或知識領域映射地圖,是顯示知識發展進程與結構關係的一係列各種不同的圖形,用可視化技術描述知識資源及其載體,挖掘、分析、構建、繪製和顯示知識及它們之間的相互聯係。 知識圖譜是通過將應用數學、圖形學、信息可視化技術、信息科學等學科的理論與方法與計量學引文分析、共現分析等方法結合,並利用可視化的圖譜形象地展示學科的核心結構、發展曆史、前沿領域以及整體知識架構達到多學科融合目的的現代理論。它能為學科研究提供切實的、有價值的參考。

知識薈萃

知識圖譜 (Knowledge Graph) 專知薈萃

綜述

  1. 知識圖譜簡史:從1950到2019

  2. 知識表示學習研究進展 劉知遠 2016

  3. 知識圖譜研究進展 漆桂林 2017

  4. 知識圖譜技術綜述 徐增林

  5. 基於表示學習的知識庫問答研究進展與展望 劉康

  6. Knowledge Graph Refinement: A Survey of Approaches and Evaluation Methods Heiko Paulheim

  7. 【專知綜述】 [幹貨] 最全知識圖譜綜述

  8. 萬字長文| 中文知識圖譜構建技術以及應用的綜述

  9. Quan Wang, Zhendong Mao, Bin Wang, Li Guo:Knowledge Graph Embedding: A Survey of Approaches and Applications. IEEE Trans. Knowl. Data Eng. 29(12): 2724-2743 (2017)

  10. Seyed Mehran Kazemi, Rishab Goel, Kshitij Jain, Ivan Kobyzev, Akshay Sethi, Peter Forsyth, Pascal Poupart:Relational Representation Learning for Dynamic (Knowledge) Graphs: A Survey. CoRR abs/1905.11485 (2019)

白皮書

  1. 《知識圖譜標準化白皮書》(2019版)發布,200頁pdf,中國電子技術標準化研究院主編
  2. 中國中文信息學會,《2018知識圖譜發展報告》,163頁pdf

模型算法

知識圖譜構建

語義單元挖掘
信息抽取:實體、屬性與關係、事件
本體構建

知識圖譜表示嵌入

知識圖譜融合

知識圖譜校驗

知識圖譜生長

多模態知識圖譜

應用

智能搜索

推薦係統

深度問答

人機對話

社區發現

入門學習

  1. 大規模知識圖譜技術 王昊奮 華東理工大學
    [http://history.ccf.org.cn/sites/ccf/xhdtnry.jsp?contentId=2794147245202]
    [https://pan.baidu.com/s/1i5w2RcD]
  2. 知識圖譜技術原理介紹 王昊奮
    [http://www.36dsj.com/archives/39306]
  3. 大規模知識圖譜的表示學習及其應用 劉知遠
    [http://www.cipsc.org.cn/kg3/]
  4. 知識圖譜的知識表現方法回顧與展望 鮑捷
    [http://www.cipsc.org.cn/kg3/]
  5. 基於翻譯模型(Trans係列)的知識表示學習 paperweekly
    [http://www.sohu.com/a/116866488_465975]
  6. 中文知識圖譜構建方法研究1,2,3
    [http://blog.csdn.net/zhangqiang1104/article/details/50212227]
    [http://blog.csdn.net/zhangqiang1104/article/details/50212261]
    [http://blog.csdn.net/zhangqiang1104/article/details/50212341]
  7. TransE算法(Translating Embedding)
    [http://blog.csdn.net/u011274209/article/details/50991385]
  8. OpenKE 劉知遠 清華大學 知識表示學習(Knowledge Embedding)旨在將知識圖譜中實體與關係嵌入到低維向量空間中,有效提升知識計算效率。
    [http://openke.thunlp.org/]
  9. 麵向大規模知識圖譜的表示學習技術 劉知遠
    [http://www.cbdio.com/BigData/2016-03/03/content_4675344.htm]
  10. 當知識圖譜“遇見”深度學習 肖仰華
    [http://caai.cn/index.php?s=/Home/Article/qikandetail/year/2017/month/04.html]
  11. NLP與知識圖譜的對接 白碩
    [http://caai.cn/index.php?s=/Home/Article/qikandetail/year/2017/month/04.html]

12.【幹貨】最全知識圖譜綜述#1: 概念以及構建技術 專知
- [http://mp.weixin.qq.com/s/bhk6iZdphif74HJlyUZOBQ]

  1. 知識圖譜綜述: 構建技術與典型應用 專知

14.知識圖譜相關會議之觀後感分享與學習總結
- [http://blog.csdn.net/eastmount/article/details/46672701]
- PPT: [http://download.csdn.net/detail/eastmount/9159689]

重要報告

  1. Jingbo Shang, Jiaming Shen, Liyuan Liu, Jiawei Han,Computer Science Department, University of Illinois at Urbana-Champaign,SIGKDD 2019 Tutorial

Tutorial

  1. 知識圖譜導論 劉 康 韓先培 [http://cips-upload.bj.bcebos.com/ccks2017/upload/CCKS2017V5.pdf]
  2. 知識圖譜構建 鄒 磊 徐波 [http://cips-upload.bj.bcebos.com/ccks2017/upload/zl.pdf]
  3. 知識獲取方法 勞 逆 邱錫鵬 [http://cips-upload.bj.bcebos.com/ccks2017/upload/2017-ccks-Knowledge-Acquisition-.pdf]
  4. 知識圖譜實踐 王昊奮 胡芳槐 [http://www.ccks2017.com/?page_id=46]
  5. 知識圖譜學習小組學習 • 第一期w1:知識提取 • 第一期w2:知識表示 • 第一期w3:知識存儲 • 第一期w4:知識檢索 [https://github.com/memect/kg-beijing]
  6. 深度學習與知識圖譜 劉知遠 韓先培 CCL2016 [http://www.cips-cl.org/static/CCL2016/tutorialpdf/T2A_%E7%9F%A5%E8%AF%86%E5%9B%BE%E8%B0%B1_part3.pdf]
  7. 中文知識圖譜-複旦大學

課程

  1. 東南大學《知識圖譜》研究生課程

  2. 浙江大學《知識圖譜》課程

    • 知識圖譜的早期理念源於萬維網之父 Tim Berners Lee 關於語義網(The Semantic Web) 的設想,旨在采用圖的結構(Graph Structure)來建模和記錄世界萬物之間的關聯關係和知識, 以便有效實現更加精準的對象級搜索。經過近二十年的發展,知識圖譜的相關技術已經在搜索引擎、智能問答、語言及視覺理解、大數據決策分析、智能設備物聯等眾多領域得到廣泛應用,被公認為是實現認知智能的重要基石。近年來,隨著自然語言處理、深度學習、圖數據處理等眾多領域的飛速發展,知識圖譜在自動化知識獲取、 基於知識的自然語言處理、基於表示學習的機器推理、基於圖神經網絡的圖挖掘與分析等領域又取得了很多新進展。本課程是麵向浙江大學研究生開設的專業選修課程。課程係統性介紹知識圖譜的基本概念、核心技術內涵和應用實踐方法,具體內容涉及知識表示與推理、圖數據庫、關係抽取與知識圖譜構建、知識圖譜表示學習與嵌入、語義搜索與知識問答、圖神經網絡與圖挖掘分析等。課程內容的設計以“基礎、前沿與實踐”相結合為基本原則,既包括基本概念介紹和實踐應用內容,也包括學術界的最新前沿進展的介紹。 [https://person.zju.edu.cn/huajun#kg]
  3. 複旦大學知識圖譜暑期課程,2018年 本次課程體係由複旦大學肖仰華教授策劃,講者來自複旦大學、南加州大學、湖南大學、香港中文大學、華東師範大學、微軟亞洲研究院、上海財經大學、東華大學、蘇州大學等青年學者。本次課程由上海財經大學承辦,由上海財經大學崔萬雲博士負責課程的本地組織工作。 [百度雲鏈接:https://pan.baidu.com/s/11DdkfxN4JG_naD1ySkIHeQ, 密碼:r5d3]

視頻教程

  1. Google 知識圖譜係列教程(1-21)

代碼

  1. ComplEx @https://github.com/ttrouill/complex
  2. EbemKG @https://github.com/pminervini/ebemkg
  3. HolE @https://github.com/mnick/holographic-embeddings
  4. Inferbeddings @https://github.com/uclmr/inferbeddings
  5. KGE-LDA @https://github.com/yao8839836/KGE-LDA
  6. KR-EAR @https://github.com/thunlp/KR-EAR
  7. mFold @https://github.com/v-shinc/mFoldEmbedding
  8. ProjE @https://github.com/bxshi/ProjE
  9. RDF2Vec @http://data.dws.informatik.uni-mannheim.de/rdf2vec/code/
  10. Resource2Vec @https://github.com/AKSW/Resource2Vec/tree/master/resource2vec-core
  11. TranslatingModel @https://github.com/ZichaoHuang/TranslatingModel
  12. wiki2vec (for DBpedia only) @https://github.com/idio/wiki2vec

領域專家

  1. Antoine Bordes [https://research.fb.com/people/bordes-antoine/]
  2. Estevam Rafael Hruschka Junior(Federal University of Sao Carlos) [http://www.cs.cmu.edu/~estevam/]
  3. 鮑捷(Memect) [[http://baojie.org/blog/]]
  4. 陳華鈞(浙江大學) [http://mypage.zju.edu.cn/huajun]
  5. 劉知遠(清華大學) [http://nlp.csai.tsinghua.edu.cn/~lzy/]
  6. 秦兵(哈爾濱工業大學) [https://m.weibo.cn/u/1880324342?sudaref=login.sina.com.cn&retcode=6102]
  7. 趙軍(中科院自動化所)http://www.nlpr.ia.ac.cn/cip/jzhao.htm
  8. 王昊奮 狗尾草智能科技公司 [http://www.gowild.cn/home/ours/index.html]
  9. 漆桂林 東南大學 [http://cse.seu.edu.cn/people/qgl/index.htm]
  10. 劉 康 中科院自動化 [http://people.ucas.ac.cn/~liukang]
  11. 韓先培 中國科學院軟件研究所 [http://www.icip.org.cn/Homepages/hanxianpei/index.htm] 12 肖仰華 複旦大學 [http://gdm.fudan.edu.cn/GDMWiki/Wiki.jsp?page=Yanghuaxiao]
  12. 李娟子 清華大學 [http://keg.cs.tsinghua.edu.cn/persons/ljz/]

Datasets

  1. DBpedia DBpedia 是一個大規模的多語言百科知識圖譜,可視為是維基百科的結構化版本。DBpedia 使用固定的模式對維基百科中的實體信息進行抽取,包括 abstract、infobox、category 和 page link 等信息。圖 2 示例了如何將維基百科中的實體“Busan”的 infobox 信息轉換成 RDF 三元組。DBpedia 目前擁有 127 種語言的超過兩千八百萬個實體與數億個 RDF 三元組,並且作為鏈接數據的核心,與許多其他數據集均存在實體映射關係。而根據抽樣評測,DBpedia 中 RDF 三元組的正確率達 88%。DBpedia 支持數據集的完全下載。 [http://wiki.dbpedia.org/]

  2. Yago 是一個整合了維基百科與 WordNet的大規模本體,它首先製定一些固定的規則對維基百科中每個實體的 infobox 進行抽取,然後利用維基百科的category進行實體類別推斷(Type Inference)獲得了大量的實體與概念之間的 IsA 關係(如:“Elvis Presley” IsA “American Rock Singers”),最後將維基百科的 category 與 WordNet 中的 Synset(一個 Synset 表示一個概念)進行映射,從而利用了 WordNet 嚴格定義的 Taxonomy 完成大規模本體的構建。隨著時間的推移,Yago 的開發人員為該本體中的 RDF 三元組增加了時間與空間信息,從而完成了 Yago2的構建,又利用相同的方法對不同語言維基百科的進行抽取,完成了 Yago3的構建。目前,Yago 擁有 10 種語言約 459 萬個實體,2400 萬個 Facts,Yago 中 Facts的正確率約為 95%。Yago 支持數據集的完全下載。 [https://www.mpi-inf.mpg.de/departments/databases-and-information-systems/research/yago-naga/yago/downloads/]

  3. Wikidata WikiData的目標是構建一個免費開放、多語言、任何人或機器都可以編輯修改的大規模鏈接知識庫。WikiData由維基百科於2012年啟動,早期得到微軟聯合創始人Paul Allen、Gordon Betty Moore基金會以及Google的聯合資助。WikiData繼承了Wikipedia的眾包協作的機製,但與Wikipedia不同,WikiData支持的是以三元組為基礎的知識條目(Items)的自由編輯。一個三元組代表一個關於該條目的陳述(Statements)。例如可以給“地球”的條目增加“<地球,地表麵積是,五億平方公裏>”的三元組陳述。截止2016年,WikiData已經包含超過2470多萬個知識條目。 [https://www.wikidata.org/wiki/Wikidata:Main_Page]

  4. BabelNet 是目前世界範圍內最大的多語言百科同義詞典,它本身可被視為一個由概念、實體、關係構成的語義網絡(Semantic Network)。BabelNet 目前有超過 1400 萬個詞目,每個詞目對應一個 synset。每個 synset 包含所有表達相同含義的不同語言的同義詞。比如:“中國”、“中華人民共和國”、“China”以及“people’srepublic of China”均存在於一個 synset 中。BabelNet 由 WordNet 中的英文 synsets 與維基百科頁麵進行映射,再利用維基百科中的跨語言頁麵鏈接以及翻譯係統,從而得到 BabelNet 的初始版本。目前 BabelNet 又整合了 Wikidata、GeoNames、OmegaWiki 等多種資源,共擁有 271 個語言版本。由於 BabelNet 中的錯誤來源主要在於維基百科與 WordNet 之間的映射,而映射目前的正確率大約在 91%。關於數據集的使用,BabelNet 目前支持 HTTP API 調用,而數據集的完全下載需要經過非商用的認證後才能完成。 [http://babelnet.org/]

  5. ConceptNet 是一個大規模的多語言常識知識庫,其本質為一個以自然語言的方式描述人類常識的大型語義網絡。ConceptNet 起源於一個眾包項目 Open Mind Common Sense,自 1999 年開始通過文本抽取、眾包、融合現有知識庫中的常識知識以及設計一些遊戲從而不斷獲取常識知識。ConceptNet 中共擁有 36 種固定的關係,如 IsA、UsedFor、CapableOf 等,圖 4 給出了一個具體的例子,從中可以更加清晰地了解 ConceptNet 的結構。ConceptNet 目前擁有 304 個語言的版本,共有超過 390 萬個概念,2800 萬個聲明(statements,即語義網絡中邊的數量),正確率約為 81%。另外,ConceptNet 目前支持數據集的完全下載。 [http://conceptnet.io/]

  6. Microsoft Concept Graph 是一個大規模的英文 Taxonomy,其中主要包含的是概念間以及實例(等同於上文中的實體)概念間的 IsA 關係,其中並不區分 instanceOf 與 subclassOf 關係。Microsoft Concept Graph 的前身是 Probase,它過自動化地抽取自數十億網頁與搜索引擎查詢記錄,其中每一個 IsA 關係均附帶一個概率值,即該知識庫中的每個 IsA 關係不是絕對的,而是存在一個成立的概率值以支持各種應用,如短文本理解、基於 taxonomy 的關鍵詞搜索和萬維網表格理解等。目前,Microsoft Concept Graph 擁有約 530 萬個概念,1250 萬個實例以及 8500 萬個 IsA 關係(正確率約為 92.8%)。關於數據集的使用,MicrosoftConcept Graph 目前支持 HTTP API 調用,而數據集的完全下載需要經過非商用的認證後才能完成。 [https://concept.research.microsoft.com/Home/Introduction]

  7. Freebase: Freebase是一個開放共享的、協同構建的大規模鏈接數據庫。Freebase是由矽穀創業公司MetaWeb於2005年啟動的一個語義網項目。2010年,穀歌收購了Freebase作為其知識圖譜數據來源之一。Freebase主要采用社區成員協作方式構建。其主要數據來源包括維基百科Wikipedia、世界名人數據庫NNDB、開放音樂數據庫MusicBrainz,以及社區用戶的貢獻等。Freebase基於RDF三元組模型,底層采用圖數據庫進行存儲。Freebase的一個特點是不對頂層本體做非常嚴格的控製,用戶可以創建和編輯類和關係的定義。2016年,穀歌宣布將Freebase的數據和API服務都遷移至Wikidata,並正式關閉了Freebase。 [https://developers.google.com/freebase/]

  8. Schema.org:Schema.org是2011年起,由Bing、Google、Yahoo和Yandex等搜索引擎公司共同支持的語義網項目。Schema.org支持各個網站采用語義標簽(Semantic Markup)的方式將語義化的鏈接數據嵌入到網頁中。搜索引擎自動搜集和歸集這些,快速的從網頁中抽取語義化的數據。Schema.org提供了一個詞彙本體用於描述這些語義標簽。截止目前,這個詞彙本體已經包含600多個類和900多個關係,覆蓋範圍包括:個人、組織機構、地點、時間、醫療、商品等。穀歌於2015年推出的定製化知識圖譜支持個人和企業在其網頁中增加包括企業聯係方法、個人社交信息等在內的語義標簽,並通過這種方式快速的彙集高質量的知識圖譜數據。截止2016年,穀歌的一份統計數據顯示,超過31%的網頁和1200萬的網站已經使用了Schema.org發布語義化的鏈接數據。其它采用了部分Schema.org功能的還包括微軟Cortana、Yandex、Pinterest、蘋果的Siri等。Schema.org的本質是采用互聯網眾包的方式生成和收集高質量的知識圖譜數據。 [http://schema.org/]

  9. LOD-Linked Open Data:LOD的初衷是為了實現Tim Berners-Lee在2006年發表的有關鏈接數據(Linked Data)作為語義網的一種實現的設想。LOD遵循了Tim提出的進行數據鏈接的四個規則,即:(1)使用URI標識萬物;(2)使用HTTP URI,以便用戶可以(像訪問網頁一樣)查看事物的描述;(3)使用RDF和SPARQL標準;(4)為事物添加與其它事物的URI鏈接,建立數據關聯。截止目前,LOD已經有1143個鏈接數據集,其中社交媒體、政府、出版和生命科學四個領域的數據占比超過90%。56% 的數據集對外至少與一個數據集建立了鏈接。被鏈接最多的是dbpedia的數據。比較常用的鏈接類型包括:foaf:knows、sioc:follows、owl:sameAs、rdfs:seeAlso、dct:spatial、skos:exactMatch等。LOD鼓勵各個數據集使用公共的開放詞彙和術語,但也允許使用各自的私有詞彙和術語。在使用的術語中,有41%是公共的開放術語 [http://lod-cloud.net/]

  10. WordNet:語言知識圖譜,包含155, 327個單詞,同義詞集117,597個,同義詞集之 間由22種關係連接 [https://wordnet.princeton.edu/]

  11. Zhishi.me :Zhishi.me是中文常識知識圖譜。主要通過從開放的百科數據中抽取結構化數據,已融合了百度百科,互動百科以及維基百科中的中文數據。 [http://zhishi.me/]

  12. CN-DBPeidia:CN-DBpedia是由複旦大學知識工場實驗室研發並維護的大規模通用領域結構化百科。CN-DBpedia主要從中文百科類網站(如百度百科、互動百科、中文維基百科等)的純文本頁麵中提取信息,經過濾、融合、推斷等操作後,最終形成高質量的結構化數據,供機器和人使用。CN-DBpedia自2015年12月份發布以來已經在問答機器人、智能玩具、智慧醫療、智慧軟件等領域產生數億次API調用量。CN-DBpedia提供全套API,並且免費開放使用。大規模商務調用,提供由IBM、華為支持的專業、穩定服務接口。 [http://kw.fudan.edu.cn/cndbpedia/search/]

  13. Medical Relation Detection Dataset in DIEBOLDS 一個醫療健康領域的知識圖譜數據集,可以用來做醫療實體的抽取和檢測,比如藥物、成分、症狀和疾病。 Lidong Bing 邴立東 [http://www.cs.cmu.edu/~lbing/#Datasets]

  14. Kinships:領域知識圖譜,描述人物之間的親屬關係,104個實體, 26種關係, 10,800個三元組。 [https://archive.ics.uci.edu/ml/datasets/kinship]

  15. UMLS:領域知識圖譜,醫學領域,描述醫學概念之間的聯係,135 個實體,49種關係,6,800個三元組。 [https://www.nlm.nih.gov/research/umls/]

  16. XLORE雙語百科知識圖譜 XLore從異構的跨語言在線百科中抽取結構化信息,並將其分享在網絡上。據我們所知,XLore是第一個大規模的中英文知識平衡的知識圖譜。目前,XLore包含663,740個概念,56,449個屬性和10,856,042個實例。這給構建任何雙語言知識平衡的大規模知識圖譜提供了一種新的方式。 [http://xlore.org/]

  17. Knowledge Vault: 機器自動構建的知識圖譜,4500萬實體,4469種關係,2.7億 三元組 [https://research.google.com/pubs/pub45634.html]

  18. ConceptNet5 ConceptNet是常識知識庫。最早源於MIT媒體實驗室的Open Mind Common Sense (OMCS)項目。OMCS項目是由著名人工智能專家Marvin Minsky於1999年建議創立。ConceptNet主要依靠互聯網眾包、專家創建和遊戲三種方法來構建。ConceptNet知識庫以三元組形式的關係型知識構成。ConceptNet5版本已經包含有2800萬關係描述。與Cyc相比,ConceptNet采用了非形式化、更加接近自然語言的描述,而不是像Cyc那樣采用形式化的謂詞邏輯。與鏈接數據和穀歌知識圖譜相比,ConceptNet比較側重於詞與詞之間的關係。從這個角度看,ConceptNet更加接近於WordNet,但是又比WordNet包含的關係類型多。此外,ConceptNet完全免費開放,並支持多種語言。 [http://www.openkg.cn/dataset/conceptnet5-chinese]

  19. 史上最大規模1.4億中文知識圖譜開源下載 本次ownthink開源了史上最大規模的中文知識圖譜,數據是以(實體、屬性、值),(實體、關係、實體)混合的形式組織, [https://github.com/ownthink/KnowledgeGraphData]

項目案例

  1. 金融領域知識圖譜

  2. 醫療領域知識圖譜

  3. 農業領域知識圖譜

進階論文

1991

1998

  • brin s. Extracting Patterns and relations from the World Wide Web[J]. lecture notes in computer Science, 1998, 1590:172-183 [Extracting Patterns and relations from the World Wide Web]

2001

  • Berners-Lee T, Hendler J, Lassila O. The semantic Web: A new Form of Web content that is Meaningful to computers will Unleash a revolution of New Possibilities[J]. Scientific American, 2001, 284(5):34-43.
    [http://xitizap.com/semantic-web.pdf]

2005

  • Guodong Z, Jian S, Jie Z, et al. Exploring Various Knowledge in relation Extraction.[c]// ACL 2005, Meeting of the Association for Computational Linguistics, Proceedings of the Conference, 2530 June, 2005, University of Michigan, USA. DBLP. 2005:419-444.
    [https://dl.acm.org/citation.cfm?id=1219893]

2008

2009

2010

2011

  • Hu W, Chen J, Qu Y. A Self-training Approach for resolving object coreference on the semantic Web[ C ]// I nternational C onference on World Wide Web. ACM, 2011:87-96.
    [https://dl.acm.org/citation.cfm?id=1963421]
  • Han X, Sun L. A Generative Entity-Mention Model for linking Entities with Knowledge base[c]// T he Meeting of the A ssociation for C omputational Linguistics: Human Language Technologies, Proceedings of the Conference, 19-24 June, 2011, Portland, Oregon, USA. DBLP, 2011:945-954.
    [https://dl.acm.org/citation.cfm?id=2002592]
  • Zhang W, Sim Y C, Su J, et al. Entity Linking with Effective Acronym Expansion, Instance Selection and topic Modeling[c]// international Joint conference on Artificial Intelligence. 2011:1909-1914.
    [http://www.aaai.org/ocs/index.php/IJCAI/IJCAI11/paper/view/3392]
  • Han X, Sun L, Zhao J. Collective Entity Linking in Web text: A Graph-based Method[c]// Proceeding of the international acM siGir conference on research and Development in Information Retrieval, SIGIR 2011, Beijing, China, July. DBLP, 2011:765-774.
    [https://dl.acm.org/citation.cfm?id=2010019]
  • Nickel M, Tresp V, Kriegel H P. A Three-Way Model for collective learning on Multi-relational Data. [C]// International Conference on Machine Learning, ICML 2011, Bellevue, Washington, Usa, June 28 July. DBLP, 2011:809-816.
    [http://www.icml-2011.org/papers/438_icmlpaper.pdf]
  • Bordes A, Weston J, Collobert R, et al. Learning structured Embeddings of Knowledge bases[c]// AAAI Conference on Artificial Intelligence, AAAI 2011, San Francisco, California, Usa, August. DBLP, 2011:301-306.
    [http://www.aaai.org/ocs/index.php/AAAI/AAAI11/paper/view/3659]
  • Lao N, Mitchell T, Cohen W W. Random Walk inference and learning in a large scale Knowledge base[c]// conference on Empirical Methods in natural Language Processing, EMNLP 2011, 27-31 July 2011, John Mcintyre Conference Centre, Edinburgh, Uk, A Meeting of Sigdat, A Special Interest Group of the ACL. DBLP, 2011:529-539.
    [https://dl.acm.org/citation.cfm?id=2145494]

2013

2014

2015

2016

  • Miwa M, Bansal M. End-to-End Relation Extraction using LSTMs on S equences and tree structures[c]// annual Meeting of the association for computational linguistics. 2016:1105-1116.
    [https://arxiv.org/abs/1601.00770]
  • Nickel M, Murphy K, Tresp V, et al. A Review of relational Machine learning for Knowledge Graphs[J]. Proceedings of the IEEE, 2016, 104(1):11-33. [http://arxiv.org/abs/1503.00759]
  • Nickel M, Rosasco L, Poggio T. Holographic Embeddings of Knowledge Graphs[J]// AAAI Conference on Artificial Intelligence. 2016:1955-1961. [http://arxiv.org/abs/1510.04935]

2017

2018

2019


初步版本,水平有限,有錯誤或者不完善的地方,歡迎大家提建議和補充,會一直保持更新,本文為專知內容組原創內容,未經允許不得轉載,如需轉載請發送郵件至fangquanyi@gmail.com或 聯係微信專知小助手(Rancho_Fang)

敬請關注//www.webtourguide.com和關注專知公眾號,獲取第一手AI相關知識

最近更新:2019-12-09

VIP內容

除了以實體為中心的知識(通常以知識圖譜(knowledge Graph, KG)的形式組織起來),事件也是世界上必不可少的一種知識,它引發了以事件為中心的知識表示形式(Event KG, EKG)的興起。它在許多機器學習和人工智能應用中發揮著越來越重要的作用,如智能搜索、問題回答、推薦和文本生成。本文從曆史、本體、實例和應用視圖等方麵對EKG進行了全麵的綜述。為了更全麵地描述EKG,我們將重點關注它的曆史、定義、模式歸納、獲取、相關的代表性圖形/係統和應用程序。研究了其發展過程和趨勢。我們進一步總結了未來EKG研究的發展方向。

知識圖譜(KG)是穀歌在2012年發布的一種流行的知識表示形式。它關注名義實體及其關係,因此代表靜態知識。然而,世界上存在著大量的事件信息,傳遞著動態的程序性知識。因此,以事件為中心的知識表示形式(如Event KG (EKG))也很重要,它將實體和事件結合在一起。它促進了許多下遊應用,如智能搜索、問答、推薦和文本生成[1]、[2]、[3]、[4]、[5]。

本文就EKG的概念及其發展進行了深入的探討。關於EKG你想知道什麼?你可能會對它的產生感興趣,也就是所謂的EKG,如何構建它,以及它的進一步應用。為了全麵介紹EKG,我們從曆史、本體論、實例和應用視圖等方麵對其進行了介紹。從曆史的觀點,我們介紹了EKG的簡史和我們導出的EKG的定義。從本體的角度,提出了與EKG相關的基本概念,以及EKG相關的任務和方法,包括事件模式歸納、腳本歸納和EKG模式歸納。從實例視圖,我們詳細闡述了事件獲取和與EKG相關的代表圖/係統。具體來說,事件獲取的重點是如何構建一個基本的EKG,並獲得一個更好的EKG。前者包括事件抽取和事件關係抽取,是最基本的任務。後者包括事件相互引用解析和事件參數補全。從應用的角度,介紹了一些基本的應用,包括腳本事件預測和時間KG預測,以及一些深層次的應用,如搜索、問答、推薦和文本生成。並對相關任務的發展過程和趨勢進行了深入的研究和分析。然後指出未來的方向。

事件知識圖譜發展曆程

什麼是EKG?曆史視角

在本節中,我們將從曆史的視角,簡要介紹EKG的曆史。然後我們根據曆史上與EKG相關的概念推導出EKG的定義。

什麼是EKG?本體視角

從本體的角度來看,我們研究了模式和相關的任務。EKG的模式描述了構成它的基本概念,比如事件類型、事件參數的角色以及事件之間的關係。事件類型和事件參數的角色構成了事件的框架,即事件模式。對於事件之間的關係,典型的腳本[30]根據一些事件關係組織一組事件,這些事件關係共同描述了常見的場景。

未來方向與挑戰

關於EKG的研究和成果有很多。然而,仍有幾個方向需要關注和進一步研究。在本節中,我們將深入探討這些未來的方向。

高性能的事件獲取

最近的事件獲取研究在有效性和效率上遠遠不能滿足應用需求。特別是事件提取和事件關係提取的精度較低。從而阻礙了高質量基礎EKG的構建。此外,現有的模型通常不重視複雜性問題。然而,高參數複雜度和高時間複雜度的模型不利於從大量數據中快速構建EKG。因此,高效率的事件獲取是未來的一個重要方向。

多模態知識處理

在現實世界中,事件可能以文本、圖像、音頻和視頻的形式呈現。然而,現有的關於EKG的研究多集中在文本處理上,而忽略了圖像、音頻、視頻中的大量信息。對於多模態事件表示學習[214]和事件抽取[215]的研究很少。實際上,不同模態的事件可以消除歧義,相互補充。因此,多模態信息的聯合利用是未來的一個重要方向。具體來說,來自所有模態的事件應在一個統一的框架中表示,事件獲取研究應注意多模態提取,EKG圖推理也應考慮多模態信息。

可解釋EKG研究

在EKG研究中,研究主要集中在用深度學習方法擬合訓練數據。然而,它們通常缺乏可解釋性,也就是說,對於它們為什麼和如何工作沒有明確的想法。實際上,了解最終結果的原因有助於在實際應用中采用它們。它是友好和令人信服的解釋為什麼最終結果是給定的。未來可解釋性EKG的研究將是一個重要的方向。

實用EKG研究

在與EKG相關的任務中,有些任務的形式化過於理想化,與現實場景相距甚遠。例如,在一個現有的事件中,隻完成一個缺失的參數或參數角色,通過從幾個候選對象中選擇它來預測未來的腳本事件,並且隻預測未來事件的一個元素。在更實際的形式下進行研究更具挑戰性,但也更有趣,對應用具有重要意義。

EKG對於許多都很重要,包括智能搜索、問題回答、推薦和文本生成。本文從不同角度對EKG的研究進行了綜述。特別地,我們深入研究了EKG的曆史、本體、實例和應用視圖。它的曆史,定義,模式歸納,獲取,相關的代表圖/係統,和應用進行了深入的研究。根據其發展趨勢,進一步總結了未來EKG研究的展望方向。

成為VIP會員查看完整內容
0
51
1

最新論文

While considering the spatial and temporal features of traffic, capturing the impacts of various external factors on travel is an essential step towards achieving accurate traffic forecasting. However, existing studies seldom consider external factors or neglect the effect of the complex correlations among external factors on traffic. Intuitively, knowledge graphs can naturally describe these correlations. Since knowledge graphs and traffic networks are essentially heterogeneous networks, it is challenging to integrate the information in both networks. On this background, this study presents a knowledge representation-driven traffic forecasting method based on spatial-temporal graph convolutional networks. We first construct a knowledge graph for traffic forecasting and derive knowledge representations by a knowledge representation learning method named KR-EAR. Then, we propose the Knowledge Fusion Cell (KF-Cell) to combine the knowledge and traffic features as the input of a spatial-temporal graph convolutional backbone network. Experimental results on the real-world dataset show that our strategy enhances the forecasting performances of backbones at various prediction horizons. The ablation and perturbation analysis further verify the effectiveness and robustness of the proposed method. To the best of our knowledge, this is the first study that constructs and utilizes a knowledge graph to facilitate traffic forecasting; it also offers a promising direction to integrate external information and spatial-temporal information for traffic forecasting. The source code is available at https://github.com/lehaifeng/T-GCN/tree/master/KST-GCN.

0
0
0
下載
預覽
Top
微信掃碼谘詢專知VIP會員
Top