主題:Ceres: Harvesting Knowledge from Semi-Structured web pages

摘要:在本次主題演講中,Xin Luna Dong講述了知識圖譜的類型,講述了為什麼需要半結構網頁,以及如何從半結構化網頁獲取知識。

嘉賓介紹:Xin Luna Dong,自2016年7月起擔任亞馬遜首席科學家,領導亞馬遜產品知識圖的構建工作,管理科學家團隊開展知識管理、數據清洗與集成、信息提取、圖形挖掘與嵌入、基於知識的搜索與推薦等方麵的研究。

成為VIP會員查看完整內容
0
5
0

相關內容

人工智能(Artificial Intelligence, AI )是研究、開發用於模擬、延伸和擴展人的智能的理論、方法、技術及應用係統的一門新的技術科學。 人工智能是計算機科學的一個分支。

知識圖譜逐漸成為互聯網上組織世界結構化知識的有力抽象化方式,它能夠捕捉企業間關鍵實體之間的關係,並整合來自多個數據源的信息。知識圖譜還開始在機器學習和自然語言處理領域發揮重要作用,它不僅可以納入世界知識作為所提取知識的目標知識表征,還能用來解釋學習到的內容。

然而,有關知識圖譜的專門課程相對較少。不過,對此感興趣的讀者不用著急,斯坦福春季課程 CS520《知識圖譜》目前已經結束,並放出了全部授課視頻。

斯坦福 CS520《知識圖譜》課程聚集了知識圖譜不同分支的研究者和業界從業者。它將展示 AI、數據庫係統以及 HCI 的最新研究與以知識圖譜為中心的集成智能係統的協同發展。

這門課程的組織者是:Vinay K. Chaudhri、Naren Chittar 和 Michael Genesereth。

  • Class 1:什麼是知識圖譜?(授課者:Denny Vrandečić、Jans Aasman、Mikhail Galkin)

  • Class 2:如何創建知識圖譜?(授課者:Juan Sequeda、Chris Ré、Xiao Ling)

  • Class 3:高級知識圖譜有哪些?(授課者:Mike Tung、Cogan Shimizu、Marie-Laure Mugnier)

  • Class 4:知識圖譜推理算法有哪些?(授課者:An Hai Doan、Yuxiao Dong、Georg Gottlob)

  • Class 5:知識圖譜如何演化?(授課者:Héctor Pérez-Urbina、José Manuel Gómez-Pérez、Mike Uschold)

  • Class 6:用戶如何與知識圖譜進行交互?(授課者:Amit Prakash、Chaomei Chen、Leilani Gilpin)

  • Class 7:工業界最流行的圖引擎有哪些?(授課者:Philip Rathle、Brad Bebee、Matei Zaharia)

  • Class 8:知識圖譜在機器學習中發揮哪些作用?(授課者:Jure Leskovec、Luna Dong、Robert offman)

  • Class 9:知識圖譜的高價值用例有哪些?(授課者:Jay Yu、Apoorv Saxena、David Newman)

  • Class 10:知識圖譜領域領域有哪些開放性研究問題?(授課者:Richard Socher、Mark Musen、RV Guha)

成為VIP會員查看完整內容
0
32
3

講座題目

從海量文本中構建和挖掘異構信息網絡:Constructing and Mining Heterogeneous Information Networks from Massive Text

講座簡介

真實世界的數據主要以非結構化文本的形式存在。數據挖掘研究的一個重大挑戰是開發有效且可伸縮的方法,將非結構化文本轉換為結構化知識。根據我們的設想,將這些文本轉換成結構化的異構信息網絡是非常有益的,在這種網絡上,可以根據用戶的需要生成可操作的知識。在本教程中,我們將全麵概述最近在這方麵的研究和發展。首先,我們介紹了一係列有效的方法,從海量的、特定於領域的文本語料庫中構建異構信息網絡。然後討論了基於用戶需求挖掘文本豐富網絡的方法。具體來說,我們關注的是可伸縮的、有效的、弱監督的、與語言無關的方法,這些方法可以處理各種文本。在真實的數據集(包括新聞文章、科學出版物和產品評論)上,我們進一步展示了如何構建信息網絡,以及如何幫助進一步的探索性分析。

講座嘉賓

Jingbo Shang(尚景波),伊利諾伊大學香檳分校計算機科學係博士生。他的研究重點是用最少的人力從大量文本語料庫中挖掘和構建結構化知識。他的研究獲得了多項著名獎項的認可,包括Yelp數據集挑戰大獎(2015)、穀歌結構化數據和數據庫管理博士研究金(2017-2019)。尚先生在大型會議(SIGMOD'17、WWW'17、sigmdd'17和sigmdd'18)上提供教程方麵有豐富的經驗。

成為VIP會員查看完整內容
0
22
0

講座題目

可擴展可持續知識圖譜構建:Scalable construction of sustainable knowledge bases

講座內容

在工業中采用語義Web技術的一個主要障礙是構建可持續的知識庫;領域專家和終端用戶常常發現語義Web語言和工具很難使用。Reasonable Ontology Templates (OTTR) 是一種語言和框架,允許對RDF/OWL上的建模模式進行簡潔的表示和實例化。它旨在滿足領域專家、拓撲工程師和數據管理人員在創建和維護高質量、可持續知識庫的過程中的需求和專長。本教程適用於渴望在工作中有效地使用建模模式的語義web從業者和拓撲工程師,也適用於業界的信息管理人員。

講座嘉賓

Martin G.Skjæveland是奧斯陸大學和Sirius可伸縮數據訪問中心的研究員,也是合理本體模板的主要開發人員。

Melinda Hodkiewicz,西澳大學教授,是一名從事多學科項目的工程學者,旨在改進維護、資產管理和安全實踐。她目前是英國艾倫圖靈研究所的訪問學者,積極參與維護記錄的本體論和自然語言處理的開發。

Leif Harald Karlsen ,奧斯陸大學的高級講師。他之前曾在天狼星可擴展數據訪問中心擔任總工程師,全職致力於OTTR的實現。

Daniel P.Lupp,是奧斯陸大學(University of Oslo)的博士後研究員,致力於研究在本體規範和維護中使用OTTR的最佳實踐方法。

成為VIP會員查看完整內容
0
32
2

報告主題:Explanation In AI: From Machine Learning To Knowledge Representation And Reasoning And Beyond

嘉賓介紹:Freddy Lecue博士是加拿大蒙特利爾泰勒斯人工智能技術研究中心的首席人工智能科學家。他也是法國索菲亞安提波利斯溫姆斯的INRIA研究所的研究員。在加入泰雷茲新成立的人工智能研發實驗室之前,他曾於2016年至2018年在埃森哲愛爾蘭實驗室擔任人工智能研發主管。在加入埃森哲之前,他是一名研究科學家,2011年至2016年在IBM research擔任大規模推理係統的首席研究員,2008年至2011年在曼徹斯特大學(University of Manchester)擔任研究員,2005年至2008年在Orange Labs擔任研究工程師。

成為VIP會員查看完整內容
Alberta-FreddyLecue-Thales-XAI-ExplanationInAI-FromMachineLearningToKnowledgeRepresentationAndReasoningAndBeyond.pdf
0
29
3

報告主題:Enterprise Knowledge Graph From Specific Business Task to Enterprise Knowledge Management

報告摘要:數據驅動的知識圖譜已被不同的社會迅速適應。已經構造了許多開放域和特定領域的知識圖,並且許多行業都受益於知識圖。當前,企業相關知識圖被歸類為特定領域,但是其應用範圍從解決一個狹窄的特定問題到企業知識管理係統。隨著傳統產業的數字化轉型,企業知識變得越來越複雜,它涉及到來自公共領域,多個特定領域以及一般企業特定領域的知識。本教程概述了當前的企業知識圖(EKG)。它根據涵蓋的知識將EKG與特定域區分開來,並提供示例以說明EKG與特定域KG之間的區別。本教程進一步將EKG歸納為三種類型:特定業務任務企業KG,特定業務單位企業KG和跨業務單位企業KG,並說明了在構造和使用這三種類型的每種產品時的特征,步驟,挑戰以及未來的研究。

邀請嘉賓:

Rong Duan,目前是華為技術有限公司企業數據管理部首席數據科學家。她正在指導一個小組構建各種支持內部用戶的AI應用程序。在她的監督下,已經構造了多個企業知識圖。在加入華為之前,Rong是AT&T Labs的首席發明家,大數據研究和史蒂文斯理工學院的兼職教授。 Rong在AT&T實驗室工作了20多年,在統計學習,數據挖掘,預測建模和業務數據的數據分析方麵擁有豐富的經驗。 Rong分別從美國史蒂文斯理工學院獲得計算機工程和計算機科學博士學位和碩士學位。她的研究興趣包括數據挖掘,統計學習理論和方法,時空風險評估和管理,數據集成和數據質量評估。她是INFORMS數據挖掘部門的前任主席,以及INFORMS International Beijing的數據挖掘集群聯合主席。還擔任過第一屆和第二屆國際係統信息學和工程學研討會的程序聯席主席,ICDM的評委,DSAA,DASFAA,INFORMS等的導師。

肖仰華,博士,GDM@FUDAN負責人。於2009年獲得複旦大學計算軟件理論博士學位。複旦大學計算機學院教授、博導、青年973科學家、上海市互聯網大數據工程中心執行副主任、上海市數據科學重點實驗室知識圖譜研究室主任、省部級重點實驗室或工程中心專家委員、上市公司等規模企業高級技術顧問或首席科學家。主要研究興趣包括:大數據管理與挖掘、圖數據庫、知識圖譜等。曾訪問美國貝勒醫學院人類基因組測序中心從事海量基因序列數據管理研究,受到微軟“鑄星計劃”支持訪問微軟亞洲研究院從事十億規模大圖數據管理和知識圖譜的研究工作。曾獲得中國計算機學會2010年度優秀博士論文提名獎、教育部高校科研成果二等獎、CCF2014自然科學二等獎、ACM(CCF)上海傑出青年科學家提名獎。作為負責人承擔30多項各類國家課題與企業課題,受到國家自然科學基金委員會、科技部、教育部、發改委、上海市科委、上海市經信委、微軟、IBM、中國電信、百度、華為等相關機構的資助。至今已經在相關領域頂級、知名國際期刊與會議發表論文70多篇,其中包括TKDE, Physical Review E, Plos One, Pattern Recognition; SIGMOD, VLDB, ICDE, IJCAI, AAAI, ICSE, OOPSLA, WWW, EMNLP, EDBT, ICDM, ECML/PKDD, SDM, ICWS, ICSM, CIKM。擔任SCI期刊Frontier of Computer Science青年副主編,長期擔任眾多國際頂級與知名學術會議的程序委員會委員,包括IJCAI,SIGKDD, ICDE, WWW, CIKM, ICDM, COLING,SDM等等;常年擔任包括科技部、教育部、國家自然科學基金、省級自然科學基金與政府專項基金以及各類獲獎項目、人才獎項的評審專家;常年擔任國際知名學術期刊Plos One, IEEE Tansaction on Computers, TKDE, KIS, WWW Journal, JCST, Physica A, IEEE Intelligent System, BMC Bioinformatic, Distributed and Parallel Database等評審人。是ACM、IEEE、AAAI會員和CCF高級會員。領導團隊構建國內首個知識庫雲服務平台(知識工場平台kw.fudan.edu.cn)。該平台目前已經服務相關企業近8億次API調用。

成為VIP會員查看完整內容
CIKM_tutorial.pdf
Enterprise_Knowledge_Graph_11012019.pdf
0
23
3

主題:From Data to Model Programming: Injecting Structured Priors for Knowledge Extraction

摘要:從序列標記到關係抽取,再到知識推理,深度神經網絡模型在知識抽取任務中取得了最先進的性能。然而,這些渴求數據的模型嚴重依賴於人工標記的訓練數據,並且經常作為黑箱組件運行,減慢了下遊應用程序的開發。在這次演講中,我將介紹我們最近在將結構化先驗知識應用到深度神經網絡模型中進行知識抽取方麵的進展,這兩個模型都是在輸入數據級別(即,以及在模型架構級別(即,對模型進行編程)。特別地,我將討論如何在命名實體識別中合並域字典,以及如何在關係提取中建立語義規則,作為輸入級結構化先驗知識的示例。對於模型編程,我將提出一個基於圖神經網絡的框架,用於在涉及常識推理的自然語言推理中捕獲多關係結構化先驗知識作為模型架構的一部分。這些解決方案共同構成了從數據到使用結構化先驗知識進行模型編程的路線圖。

嘉賓簡介:任翔,美國南加州大學計算機科學係助理教授,獲美國南加州大學ISI聘任。他也是智能和知識發現(INK)研究實驗室的主任,ACM SIGKDD和數據挖掘(SIGKDD)的信息主任,以及USC機器學習中心的成員。之前,他是斯坦福大學的研究學者,並在伊利諾伊大學香檳分校獲得了計算機科學博士學位。Ren博士的研究重點是開發標簽高效的計算方法,從自然語言數據中提取機器可操作的知識(例如,組合、圖形結構表示),並對知識結構進行神經推理。他的研究導致一本書和50多個出版物,覆蓋著超過會議教程(KDD、WWW NAACL),並獲得了獎項包括穀歌AI教師獎,摩根大通AI研究獎,亞馬遜研究獎,ACM SIGKDD論文獎(2018),WWW最佳海報亞軍(2018),大衛·j·Kuck優秀論文獎(2017),穀歌博士獎學金(2016),和Yelp數據集挑戰獎(2015)。他是福布斯亞洲30位30歲以下富豪之一。

成為VIP會員查看完整內容
2_CCKS_ATT_XiangRen.pdf
0
7
0

報告主題:Natural Language Interface to Knowledge Graph (our experience)

報告摘要:世界上大量的數據存儲在關係數據庫和知識圖譜中。必須學習結構化查詢語言(SQL)這樣的編程語言,或者使用固定的查詢表單來查詢數據,即使是非常簡單的查詢。SQL和SPARQL分別是訪問關係數據庫和知識圖譜最常用的接口。但是,這需要用戶對查詢語言、數據模式和數據庫運行環境有很好的理解,這需要很長的訓練時間,對於偶爾查詢數據的用戶來說是不現實的。在本教程中,我將介紹這一領域的研究進展,並討論未來的研究方向。。

嘉賓簡介:嚴錫峰(Xifeng Yan)是加州大學聖塔芭芭拉分校的副教授。他擔任計算機科學Venkatesh Narayanamurti主席。他獲得了博士學位。於2006年獲得伊利諾伊大學香檳分校計算機科學博士學位。2006年至2008年,他是IBM TJ Watson研究中心的研究人員。他一直致力於信息網絡中圖形的建模,管理和挖掘,計算機係統,社交媒體和生物信息學。他的作品得到了廣泛的引用,每個Google Scholar的引用次數超過9000,並且下載了數千次軟件。他獲得了NSF職業獎,IBM發明成就獎,ACM-SIGMOD論文亞軍獎和IEEE ICDM十年最高影響力論文獎。

成為VIP會員查看完整內容
1_CCKS_ATT_XifengYan.pdf
0
7
0
Top