https://crad.ict.ac.cn/CN/10.7544/issn1000-1239.2021.20200402

"> 電子病曆文本挖掘研究綜述 - 專知VIP

摘要: 電子病曆是醫院信息化發展的產物, 其中包含了豐富的醫療信息和臨床知識, 是輔助臨床決策和藥物挖掘等的重要資源.因此, 如何高效地挖掘大量電子病曆數據中的信息是一個重要的研究課題.近些年來, 隨著計算機技術尤其是機器學習以及深度學習的蓬勃發展, 對電子病曆這一特殊領域數據的挖掘有了更高的要求.電子病曆綜述旨在通過對電子病曆研究現狀的分析來指導未來電子病曆文本挖掘領域的發展.具體而言, 綜述首先介紹了電子病曆數據的特點和電子病曆的數據預處理的常用方法;然後總結了電子病曆數據挖掘的4個典型任務(醫學命名實體識別、關係抽取、文本分類和智能問診), 並且圍繞典型任務介紹了常用的基本模型以及研究人員在任務上的部分探索;最後結合糖尿病和心腦血管疾病2類特定疾病, 對電子病曆的現有應用場景做了簡單介紹.

https://crad.ict.ac.cn/CN/10.7544/issn1000-1239.2021.20200402

成為VIP會員查看完整內容
0
35
0

相關內容

文本情感分析是自然語言處理領域的一個重要分支,廣泛應用於輿情分析和內容推薦等方麵,是近 年來的研究熱點。根據使用的不同方法,將其劃分為基於情感詞典的情感分析方法、基於傳統機器學習的情 感分析方法、基於深度學習的情感分析方法。通過對這三種方法進行對比,分析其研究成果,並對不同方法 的優缺點進行歸納總結,介紹相關數據集和評價指標,及應用場景,對情感分析子任務進行簡單概括,發現 將來的情感分析問題的研究趨勢及應用領域,並為研究者在相關領域方麵提供一定的幫助和指導。

成為VIP會員查看完整內容
0
14
0

摘要: 需求獲取和建模是指從需求文本或記錄中獲取顯式和隱式的需求,並通過表格化、圖形化、形式化等方法構建相應模型的過程,是軟件開發過程中極為關鍵的一步,為後續係統設計與實現鋪平道路,提高軟件開發效率和質量,提升軟件係統穩定性和可行性.研究者們在需求獲取與建模方麵獲得了一係列研究成果,根據其關注階段不同,可以將它們分為需求知識提取、需求知識分類和需求模型構建3個方麵.鑒於傳統方法在知識獲取、模型構建的準確性和效率方麵一直存在弊端,近年來,越來越多的研究者們將具有廣泛應用性的人工智能技術與需求獲取、需求分類、需求建模方法相結合,提出了一係列智能需求獲取與建模的方法和技術,從而彌補了傳統方法的不足.著重從智能需求獲取與建模角度著手,對近年來的研究進展進行梳理和總結.主要內容包括:1)統計並分析人工智能技術在需求知識提取、需求知識分類和需求模型構建中使用的方法和技術;2)總結了智能需求獲取與建模過程中采用的驗證方法和評估方法;3)從科學問題和技術難點2個方麵歸納得出目前智能需求獲取與建模的關鍵問題,圍繞集成式和動態化模型構建、與其他軟件工程活動關聯、智能需求知識分類的粒度、數據集構建、評估指標構建和工具支持6部分,闡述了上述問題的可能解決思路和未來發展趨勢

https://crad.ict.ac.cn/CN/10.7544/issn1000-1239.2021.20200740

成為VIP會員查看完整內容
0
16
0

近年來,隨著互聯網及智能移動設備的發展和普及,豐富了廣告的推送方式和投放平台.但是傳統的廣告推送無法滿足用戶對個性化廣告的需求,導致用戶對廣告產生抵觸情緒,給廣告推送帶來極大的挑戰.個性化廣告推薦係統作為應對這些挑戰的有效手段,成為個性化服務領域的研究熱點之一.個性化廣告推薦係統獲取用戶興趣偏好,利用多種個性化廣告推薦技術,通過PC端、移動終端等多平台為用戶提供個性化廣告,並且已經在一些應用係統中取得不錯的效果.本文對個性化廣告推薦係統的研究進展進行係統地綜述,從個性化廣告推薦的概述出發,對近年來個性化廣告推薦的關鍵技術進行深入分析,包括數據采集與預處理、用戶偏好獲取、個性化廣告推薦技術等.統計分析了個性化廣告推薦中使用的多種數據集和評價指標,總結當前個性化廣告推薦在傳統互聯網、移動服務、數字標牌、IPTV等場景下的應用.最後對個性化廣告推薦係統存在問題和未來深入研究的方向進行討論和展望.

http://cjc.ict.ac.cn/online/onlinepaper/zyj-202128100325.pdf

成為VIP會員查看完整內容
0
29
0

近年來,互聯網技術的蓬勃發展極大地便利了人類的日常生活,不可避免的是互聯網中的信息呈井噴式爆發,如何從中快速有效地獲取所需信息顯得極為重要.自動文本摘要技術的出現可以有效緩解該問題,其作為自然語言處理和人工智能領域的重要研究內容之一,利用計算機自動地從長文本或文本集合中提煉出一段能準確反映源文中心內容的簡潔連貫的短文.探討自動文本摘要任務的內涵,回顧和分析了自動文本摘要技術的發展,針對目前主要的2種摘要產生形式(抽取式和生成式)的具體工作進行了詳細介紹,包括特征評分、分類算法、線性規劃、次模函數、圖排序、序列標注、啟發式算法、深度學習等算法.並對自動文本摘要常用的數據集以及評價指標進行了分析,最後對其麵臨的挑戰和未來的研究趨勢、應用等進行了預測.

http://crad.ict.ac.cn/CN/10.7544/issn1000-1239.2021.20190785

21世紀互聯網快速發展,文本數據呈指數級增長,用戶如何快速有效地從海量信息中提煉出所需的有用資料,已經成為一個亟待解決的問題.自動文本摘要(automaticsummarization)技術,又被稱為自動文摘,它的出現恰逢其時,為用戶提供簡潔而不丟失原意的信息,可以有效地降低用戶的信息負擔、提高用戶的信息獲取速度,將用戶從繁瑣、冗餘的信息中解脫出來,節省了大量的人力物力,在信息檢索、輿情分析、內容審查等領域具有較高的研究價值.

早期的文本摘要普遍是通過人工來完成的,文本數據量的激增使得這項工作日漸繁重且效率低下,逐漸不能滿足用戶的需求.近年來,隨著對非結構化文本數據研究的進展,自動文摘任務得到了廣泛的關注和研究,其已成為自然語言處理領域的研究熱點之一.學術界湧現出大量圍繞算法技術、數據集、評價指標和係統的相關工作,這些工作在一定程度上取得了較好的效果,快速應用到金融、新聞、醫學、媒體等各個領域,如社交媒體摘要[1]、新聞摘要[2]、專利摘要[3]、觀點摘要[4]以及學術文獻摘要[5].盡管如此,目前計算機自動產生的摘要還遠不能達到人工摘要的質量,在該任務上還有很大的提升空間,仍需要相關研究者進一步探索有效的自動文摘技術.

目前已有一些文獻對自動文摘任務進行了調研和評估.在早期的工作中,萬小軍等人[6]首次將自動文摘的研究工作從內容表示、權重計算、內容選擇、內容組織4個角度進行了深度剖析,並對發展趨勢進行了展望,為之後的研究工作打下了良好的基礎.王俊麗等人[7]則主要針對抽取式自動文摘的圖排序算法進行了介紹.曹洋等人[8]重點分析了3種主要的機器學習算法在自動文摘中的應用.此外,還有一些相關的研究工作,但他們基本僅針對自動文摘中的單個技術方向進行詳細綜述,經過調研發現目前尚缺乏對自動文摘任務進行全麵的研究綜述.

基於此,為了便於研究者在現有研究工作的基礎上取得更好的進展,非常有必要對目前自動文摘的研究成果進行全麵的分析和總結.因此,我們查閱整理了近年來學術界相關的研究工作,包括自然語言處理、人工智能等相關領域的國際會議和學術期刊,對這些研究成果按照摘要產生的技術算法進行了詳細的分類以及優缺點的對比與總結.除此之外,本文對自動文本摘要研究常用的數據集、評價方法進行歸納總結,最後對自動文摘任務未來的研究趨勢進行展望與總結.

成為VIP會員查看完整內容
1
24
0

我們生活在一個由大量不同模態內容構建而成的多媒體世界中,不同模態信息之間具有高度的相關性和互補性,多模態表征學習的主要目的就是挖掘出不同模態之間的共性和特性,產生出可以表示多模態信息的隱含向量.該文章主要介紹了目前應用較廣的視覺語言表征的相應研究工作,包括傳統的基於相似性模型的研究方法和目前主流的基於語言模型的預訓練的方法.目前比較好的思路和解決方案是將視覺特征語義化然後與文本特征通過一個強大的特征抽取器產生出表征,其中Transformer[1]作為主要的特征抽取器被應用表征學習的各類任務中.文章分別從研究背景、不同研究方法的劃分、測評方法、未來發展趨勢等幾個不同角度進行闡述.

http://www.jos.org.cn/jos/ch/reader/view_abstract.aspx?file_no=6125&flag=1

成為VIP會員查看完整內容
0
56
1

摘要: 在自然語言處理領域,信息抽取一直以來受到人們的關注.信息抽取主要包括3項子任務:實體抽取、關係抽取和事件抽取,而關係抽取是信息抽取領域的核心任務和重要環節.實體關係抽取的主要目標是從自然語言文本中識別並判定實體對之間存在的特定關係,這為智能檢索、語義分析等提供了基礎支持,有助於提高搜索效率,促進知識庫的自動構建.綜合闡述了實體關係抽取的發展曆史,介紹了常用的中文和英文關係抽取工具和評價體係.主要從4個方麵展開介紹了實體關係抽取方法,包括:早期的傳統關係抽取方法、基於傳統機器學習、基於深度學習和基於開放領域的關係抽取方法,總結了在不同曆史階段的主流研究方法以及相應的代表性成果,並對各種實體關係抽取技術進行對比分析.最後,對實體關係抽取的未來重點研究內容和發展趨勢進行了總結和展望.

http://crad.ict.ac.cn/CN/10.7544/issn1000-1239.2020.20190358#1

成為VIP會員查看完整內容
0
68
2
小貼士
相關VIP內容
專知會員服務
14+閱讀 · 4月20日
專知會員服務
16+閱讀 · 4月3日
專知會員服務
15+閱讀 · 3月19日
專知會員服務
29+閱讀 · 2月27日
專知會員服務
18+閱讀 · 2月16日
專知會員服務
24+閱讀 · 1月31日
專知會員服務
48+閱讀 · 2020年12月9日
專知會員服務
56+閱讀 · 2020年12月3日
專知會員服務
68+閱讀 · 2020年7月19日
數據標注研究綜述,軟件學報,19頁pdf
專知會員服務
54+閱讀 · 2020年2月20日
相關論文
Training Value-Aligned Reinforcement Learning Agents Using a Normative Prior
Md Sultan Al Nahian,Spencer Frazier,Brent Harrison,Mark Riedl
0+閱讀 · 4月19日
Wenhao Yu,Chenguang Zhu,Zaitang Li,Zhiting Hu,Qingyun Wang,Heng Ji,Meng Jiang
6+閱讀 · 2020年10月9日
Jian Wang,Junhao Liu,Wei Bi,Xiaojiang Liu,Kejing He,Ruifeng Xu,Min Yang
11+閱讀 · 2019年12月16日
Fabio Petroni,Tim Rocktäschel,Patrick Lewis,Anton Bakhtin,Yuxiang Wu,Alexander H. Miller,Sebastian Riedel
5+閱讀 · 2019年9月4日
Fine-tuning BERT for Joint Entity and Relation Extraction in Chinese Medical Text
Kui Xue,Yangming Zhou,Zhiyuan Ma,Tong Ruan,Huanhuan Zhang,Ping He
4+閱讀 · 2019年8月21日
Kamran Kowsari,Kiana Jafari Meimandi,Mojtaba Heidarysafa,Sanjana Mendu,Laura E. Barnes,Donald E. Brown
11+閱讀 · 2019年6月25日
Neural Response Generation with Meta-Words
Can Xu,Wei Wu,Chongyang Tao,Huang Hu,Matt Schuerman,Ying Wang
4+閱讀 · 2019年6月14日
HCqa: Hybrid and Complex Question Answering on Textual Corpus and Knowledge Graph
Somayeh Asadifar,Mohsen Kahani,Saeedeh Shekarpour
3+閱讀 · 2019年1月3日
Paraphrase Generation with Deep Reinforcement Learning
Zichao Li,Xin Jiang,Lifeng Shang,Hang Li
3+閱讀 · 2018年8月23日
Tommaso Soru,Stefano Ruberto,Diego Moussallem,Edgard Marx,Diego Esteves,Axel-Cyrille Ngonga Ngomo
7+閱讀 · 2018年3月21日
Top