當看到這些材料時,一個明顯的問題可能會出現:“為什麼還要寫一本深度學習和自然語言處理的書呢?”一些優秀的論文已經出版,涵蓋了深度學習的理論和實踐方麵,以及它在語言處理中的應用。然而,從我教授自然語言處理課程的經驗來看,我認為,盡管這些書的質量非常好,但大多數都不是針對最有可能的讀者。本書的目標讀者是那些在機器學習和自然語言處理之外的領域有經驗的人,並且他們的工作至少部分地依賴於對大量數據,特別是文本數據的自動化分析。這些專家可能包括社會科學家、政治科學家、生物醫學科學家,甚至是對機器學習接觸有限的計算機科學家和計算語言學家。

現有的深度學習和自然語言處理書籍通常分為兩大陣營。第一個陣營專注於深度學習的理論基礎。這對前麵提到的讀者肯定是有用的,因為在使用工具之前應該了解它的理論方麵。然而,這些書傾向於假設一個典型的機器學習研究者的背景,因此,我經常看到沒有這種背景的學生很快就迷失在這樣的材料中。為了緩解這個問題,目前存在的第二種類型的書集中在機器學習從業者;也就是說,如何使用深度學習軟件,而很少關注理論方麵。我認為,關注實際方麵同樣是必要的,但還不夠。考慮到深度學習框架和庫已經變得相當複雜,由於理論上的誤解而濫用它們的可能性很高。這個問題在我的課程中也很常見。

因此,本書旨在為自然語言處理的深度學習搭建理論和實踐的橋梁。我涵蓋了必要的理論背景,並假設讀者有最少的機器學習背景。我的目標是讓任何上過線性代數和微積分課程的人都能跟上理論材料。為了解決實際問題,本書包含了用於討論的較簡單算法的偽代碼,以及用於較複雜體係結構的實際Python代碼。任何上過Python編程課程的人都應該能夠理解這些代碼。讀完這本書後,我希望讀者能有必要的基礎,立即開始構建真實世界的、實用的自然語言處理係統,並通過閱讀有關這些主題的研究出版物來擴展他們的知識。

http://clulab.cs.arizona.edu/gentlenlp/gentlenlp-book-05172020.pdf

"> 【2020新書】深度學習自然語言處理簡明導論,69頁pdf - 專知VIP

當看到這些材料時,一個明顯的問題可能會出現:“為什麼還要寫一本深度學習和自然語言處理的書呢?”一些優秀的論文已經出版,涵蓋了深度學習的理論和實踐方麵,以及它在語言處理中的應用。然而,從我教授自然語言處理課程的經驗來看,我認為,盡管這些書的質量非常好,但大多數都不是針對最有可能的讀者。本書的目標讀者是那些在機器學習和自然語言處理之外的領域有經驗的人,並且他們的工作至少部分地依賴於對大量數據,特別是文本數據的自動化分析。這些專家可能包括社會科學家、政治科學家、生物醫學科學家,甚至是對機器學習接觸有限的計算機科學家和計算語言學家。

現有的深度學習和自然語言處理書籍通常分為兩大陣營。第一個陣營專注於深度學習的理論基礎。這對前麵提到的讀者肯定是有用的,因為在使用工具之前應該了解它的理論方麵。然而,這些書傾向於假設一個典型的機器學習研究者的背景,因此,我經常看到沒有這種背景的學生很快就迷失在這樣的材料中。為了緩解這個問題,目前存在的第二種類型的書集中在機器學習從業者;也就是說,如何使用深度學習軟件,而很少關注理論方麵。我認為,關注實際方麵同樣是必要的,但還不夠。考慮到深度學習框架和庫已經變得相當複雜,由於理論上的誤解而濫用它們的可能性很高。這個問題在我的課程中也很常見。

因此,本書旨在為自然語言處理的深度學習搭建理論和實踐的橋梁。我涵蓋了必要的理論背景,並假設讀者有最少的機器學習背景。我的目標是讓任何上過線性代數和微積分課程的人都能跟上理論材料。為了解決實際問題,本書包含了用於討論的較簡單算法的偽代碼,以及用於較複雜體係結構的實際Python代碼。任何上過Python編程課程的人都應該能夠理解這些代碼。讀完這本書後,我希望讀者能有必要的基礎,立即開始構建真實世界的、實用的自然語言處理係統,並通過閱讀有關這些主題的研究出版物來擴展他們的知識。

http://clulab.cs.arizona.edu/gentlenlp/gentlenlp-book-05172020.pdf

成為VIP會員查看完整內容
0
44
1

相關內容

機器學習的一個分支,它基於試圖使用包含複雜結構或由多重非線性變換構成的多個處理層對數據進行高層抽象的一係列算法。

知識薈萃

精品入門和進階教程、論文和代碼整理等

更多

查看相關VIP內容、論文、資訊等

概率論起源於17世紀的法國,當時兩位偉大的法國數學家,布萊斯·帕斯卡和皮埃爾·德·費馬,對兩個來自機會博弈的問題進行了通信。帕斯卡和費馬解決的問題繼續影響著惠更斯、伯努利和DeMoivre等早期研究者建立數學概率論。今天,概率論是一個建立良好的數學分支,應用於從音樂到物理的學術活動的每一個領域,也應用於日常經驗,從天氣預報到預測新的醫療方法的風險。

本文是為數學、物理和社會科學、工程和計算機科學的二、三、四年級學生開設的概率論入門課程而設計的。它提出了一個徹底的處理概率的想法和技術為一個牢固的理解的主題必要。文本可以用於各種課程長度、水平和重點領域。

在標準的一學期課程中,離散概率和連續概率都包括在內,學生必須先修兩個學期的微積分,包括多重積分的介紹。第11章包含了關於馬爾可夫鏈的材料,為了涵蓋這一章,一些矩陣理論的知識是必要的。

文本也可以用於離散概率課程。材料被組織在這樣一種方式,離散和連續的概率討論是在一個獨立的,但平行的方式,呈現。這種組織驅散了對概率過於嚴格或正式的觀點,並提供了一些強大的教學價值,因為離散的討論有時可以激發更抽象的連續的概率討論。在離散概率課程中,學生應該先修一學期的微積分。

為了充分利用文中的計算材料和例子,假設或必要的計算背景很少。所有在文本中使用的程序都是用TrueBASIC、Maple和Mathematica語言編寫的。

成為VIP會員查看完整內容
0
34
0

這本書是關於運用機器和深度學習來解決石油和天然氣行業的一些挑戰。這本書開篇簡要討論石油和天然氣勘探和生產生命周期中不同階段的數據流工業操作。這導致了對一些有趣問題的調查,這些問題很適合應用機器和深度學習方法。最初的章節提供了Python編程語言的基礎知識,該語言用於實現算法;接下來是監督和非監督機器學習概念的概述。作者提供了使用開源數據集的行業示例以及對算法的實際解釋,但沒有深入研究所使用算法的理論方麵。石油和天然氣行業中的機器學習涵蓋了包括地球物理(地震解釋)、地質建模、油藏工程和生產工程在內的各種行業主題。

在本書中,重點在於提供一種實用的方法,提供用於實現機器的逐步解釋和代碼示例,以及用於解決油氣行業現實問題的深度學習算法。

你將學到什麼

  • 了解石油和天然氣行業的端到端的行業生命周期和數據流
  • 了解計算機編程和機器的基本概念,以及實現所使用的算法所需的深度學習
  • 研究一些有趣的行業問題,這些問題很有可能被機器和深度學習解決
  • 發現在石油和天然氣行業中執行機器和深度學習項目的實際考慮和挑戰

這本書是給誰的

  • 石油和天然氣行業的專業人員,他們可以受益於對機器的實際理解和解決現實問題的深度學習方法。
成為VIP會員查看完整內容
0
57
1

本教程介紹了機器學習(ML)的一些主要概念。從工程的角度來看,ML領域圍繞著實現科學原理的軟件開發: (i) 對一些現象設定一個假設(選擇一個模型),(ii) 收集數據來驗證假設(驗證模型),(iii) 完善假設(迭代)。基於這一原理的一類重要算法是梯度下降法,它旨在迭代地細化由某個(權重)向量參數化的模型。通過結合假設空間(模型)、質量度量(損失)和模型優化(優化方法)的計算實現的不同選擇,可以得到大量的ML方法。目前許多被認為是(人工)智能的係統都是基於幾種基本機器學習方法的組合。在形式化ML問題的主要構建模塊之後,討論了ML方法的一些流行算法設計模式。本教程是在“機器學習:基本原理”和“人工智能”兩門課程的課堂筆記基礎上發起來的,這兩門課程我從2015年開始在阿爾托大學(Aalto University)與人合作授課。

//www.webtourguide.com/paper/e45f282b068a1584cb0eaf0f0b338c20

成為VIP會員查看完整內容
0
62
0

這本書的前半部分快速而徹底地概述了Python的所有基礎知識。你不需要任何以前的經驗與編程開始,我們將教你一切你需要知道,一步一步。

第二部分著重於用Python以實用的方式解決有趣的、真實的問題。一旦你掌握了基礎知識,你就會通過跟隨我們的動手編程練習和項目迅速提高。

我們在書中的每一頁都精心安排了漂亮的排版,代碼示例的語法高亮顯示,以及教學截圖,這樣你可以有效地處理和記憶信息:

所有材料都是Python 3.9的最新版本,Python編程語言在2020年發布的最新和最好的版本。簡而言之,以下是你將學到的Python基礎知識:Python 3的實用介紹:

安裝和運行Python:在Windows、macOS或Linux上設置Python 3.9編碼環境

  • 核心Python 3概念和約定:解釋器會話、腳本、查找和修複代碼bug、如何組織代碼和構造Python程序、如何有效地學習和實踐

  • Python 3.9基本原理:變量、基本數據類型、函數和循環、條件邏輯和控製流、字符串格式、列表/元組/字典、文件輸入和輸出、錯誤處理。

  • 中級Python概念:麵向對象編程(OOP)、正則表達式、名稱空間和作用域、異常處理、安裝第三方包。

  • Python的實際使用:創建和修改PDF文件、使用數據庫、從web下載和抓取內容、數據科學基礎(科學計算和繪圖)、圖形用戶界麵和GUI編程。

成為VIP會員查看完整內容
0
40
0

現在來自密西根州立大學的湯繼良團隊即將出版一本全麵性介紹圖深度學習的書:《Deep Learning on Graphs》。

全書概要

為了最好地適應具有不同背景和閱讀目的的讀者,該書由四個部分組成。 第1部分介紹了基本概念;第2部分討論了該領域最成熟的方法;第3部分介紹了最具代表性的實際應用,而第4部分介紹了有可能成為將來研究熱點的高級方法和應用。每部分的內容如下:

第1部分:基本概念篇

在該部分的章節重點介紹圖和深度學習的基礎知識,這些基礎將為圖的深度學習奠定基礎。在第1章中,介紹了圖的關鍵概念和屬性,圖傅裏葉變換,圖形信號處理,並正式定義了各種類型的複雜圖和在圖上的計算任務。在第2章中,討論了各種最基礎的神經網絡模型,訓練深度模型的關鍵方法以及防止訓練過程中過度擬合的實用技術。

第2部分:方法篇

這些章節涵蓋了從基本設置到高級設置的最成熟的圖深度學習方法。在第3章中,從信息保存的角度介紹了一種通用的圖嵌入框架,提供了有關在圖像上保留多種類型信息的代表性算法的技術細節,並介紹了專門為複雜形設計的嵌入方法。典型的圖神經網絡模型包括兩個重要操作,即圖過濾操作和圖池化操作。

在第4章中,回顧了最新的圖過濾和池化操作,並討論了如何在給定下遊任務的時學習GNN參數。GNNs是傳統深度模型在圖上的泛化,因此它們繼承了傳統深度模型的缺點,容易受到對抗攻擊。

在第5章中,重點介紹圖對抗攻擊的概念和定義,並詳細介紹了具有代表性的對抗攻擊和防禦技術。GNN執行跨層鄰域的遞歸擴展。單個節點鄰域的擴展會迅速涉及圖的很大一部分甚至整個圖。因此,可擴展性是GNN需要解決的緊迫問題。

在6章中詳細介紹了用於可擴展性GNN的代表性技術。在第7章中,討論了為更複雜的圖設計的GNN模型。為了使深度學習技術能夠在更廣泛的設置下推進更多的圖應用,在第8中介紹了GNN之外的眾多圖深度模型。

第3部分:實際應用篇 圖提供了真實數據的通用表示方法;因此,在圖深度學習方法已應用於各個領域。在這部分的章節中,將介紹了GNN的最具代表性的應用,包括第9章中的自然語言處理,第10章中的計算機視覺,第11章中的數據挖掘和第12章中的生物化學與醫療保健。

第4部分:進展篇 在該部分章節中,重點介紹方法和實際應用方麵的最新進展。在13章中,從表達性,深度,公平性,可解釋性和自我監督學習方麵介紹了高級GNNs。在第14中,討論了GNN應用的更多領域,包括組合優化,物理,程序表示, 和計算機網絡。

英文書預印本免費下載鏈接如下。大家可以訂閱該書。訂閱者會自動推送關於該書的最新信息包括針對該書的中英文版的幻燈片和教程視頻。同時歡迎大家提供反饋。

英文書:http://cse.msu.edu/~mayao4/dlg_book/

成為VIP會員查看完整內容
0
191
5

自Goodfellow等人2014年開創性的工作以來,生成式對抗網(GAN)就受到了相當多的關注。這種關注導致了GANs的新思想、新技術和新應用的爆炸。為了更好地理解GANs,我們需要理解其背後的數學基礎。本文試圖從數學的角度對GANs進行概述。許多學數學的學生可能會發現關於GAN的論文更難以完全理解,因為大多數論文是從計算機科學和工程師的角度寫的。這篇論文的目的是用他們更熟悉的語言來介紹GANs。

成為VIP會員查看完整內容
0
42
0

介紹

這本書在保持非常務實的教導和結果導向付出很大的精力。構建聊天機器人不隻是完成一個教程或遵循幾個步驟,它本身就是一種技能。這本書肯定不會用大量的文本和過程讓你感到無聊;相反,它采用的是邊做邊學的方法。到目前為止,在你的生活中,你肯定至少使用過一個聊天機器人。無論你是不是一個程序員,一旦你瀏覽這本書,你會發現構建模塊的聊天機器人,所有的奧秘將被揭開。建立聊天機器人可能看起來很困難,但這本書將讓你使它如此容易。我們的大腦不是用來直接處理複雜概念的;相反,我們一步一步地學習。當你讀這本書的時候,從第一章到最後一章,你會發現事情的進展是多麼的清晰。雖然你可以直接翻到任何一章,但我強烈建議你從第一章開始,因為它肯定會支持你的想法。這本書就像一個網絡係列,你在讀完一章之後就無法抗拒下一章的誘惑。在閱讀完這本書後,你所接觸到的任何聊天機器人都會在你的腦海中形成一幅關於聊天機器人內部是如何設計和構建的畫麵。

這本書適合誰?

這本書將作為學習與聊天機器人相關的概念和學習如何建立他們的一個完整的資源。那些將會發現這本書有用的包括: Python web開發人員希望擴大他們的知識或職業到聊天機器人開發。 學生和有抱負的程序員想獲得一種新的技能通過親身體驗展示的東西,自然語言愛好者希望從頭開始學習。 企業家如何構建一個聊天機器人的偉大的想法,但沒有足夠的技術關於如何製作聊天機器人的可行性信息。 產品/工程經理計劃與聊天機器人相關項目。

如何使用這本書?

請記住,這本書的寫作風格和其他書不一樣。讀這本書的時候要記住,一旦你完成了這本書,你就可以自己建造一個聊天機器人,或者教會別人如何建造一個聊天機器人。在像閱讀其他書籍一樣閱讀這本書之前,務必記住以下幾點:

  • 這本書涵蓋了構建聊天機器人所需的幾乎所有內容,而不是現有內容。
  • 這本書是關於花更多的時間在你的係統上做事情的,這本書就在你身邊。確保您執行每個代碼片段並嚐試編寫代碼;不要複製粘貼。
  • 一定要按照書中的步驟去做;如果你不理解一些事情,不要擔心。你將在本章的後麵部分了解到。
  • 可以使用本書所提供的源代碼及Jupyter NoteBook作為參考。

內容概要

  • Chapter 1: 在本章中,你將從商業和開發人員的角度了解與聊天機器人相關的事情。這一章為我們熟悉chatbots概念並將其轉換為代碼奠定了基礎。希望在本章結束時,你會明白為什麼你一定要為自己或你的公司創建一個聊天機器人。
  • Chapter 2: 在本章中會涉及聊天機器人的自然語言處理,你將學習到聊天機器人需要NLP時應該使用哪些工具和方法。這一章不僅教你在NLP的方法,而且還采取實際的例子和演示與編碼的例子。本章還討論了為什麼使用特定的NLP方法可能需要在聊天機器人。注意,NLP本身就是一種技能。
  • Chapter 3: 在本章中,你將學習如何使用像Dialogflow這樣的工具以一種友好而簡單的方式構建聊天機器人。如果你不是程序員,你肯定會喜歡它,因為它幾乎不需要編程技能。
  • Chapter 4:在本章中,你將學習如何以人們想要的方式構建聊天機器人。標題說的很艱難,但一旦你完成了前一章,你會想要更多,因為這一章將教如何建立內部聊天機器人從零開始,以及如何使用機器學習算法訓練聊天機器人。
  • Chapter 5:在本章中,部署你的聊天機器人純粹是設計給你的聊天機器人應用一個最後的推動。當你經曆了創建聊天機器人的簡單和艱難的過程後,你肯定不想把它留給自己。你將學習如何展示你的聊天機器人到世界使用Facebook和Slack,最後,整合他們在你自己的網站。
成為VIP會員查看完整內容
Building Chatbots with Python.pdf
0
90
25

本備忘單是機器學習手冊的濃縮版,包含了許多關於機器學習的經典方程和圖表,旨在幫助您快速回憶起機器學習中的知識和思想。

這個備忘單有兩個顯著的優點:

  1. 清晰的符號。數學公式使用了許多令人困惑的符號。例如,X可以是一個集合,一個隨機變量,或者一個矩陣。這是非常混亂的,使讀者很難理解數學公式的意義。本備忘單試圖規範符號的使用,所有符號都有明確的預先定義,請參見小節。

  2. 更少的思維跳躍。在許多機器學習的書籍中,作者省略了數學證明過程中的一些中間步驟,這可能會節省一些空間,但是會給讀者理解這個公式帶來困難,讀者會在中間迷失。

成為VIP會員查看完整內容
0
125
27
小貼士
相關VIP內容
專知會員服務
34+閱讀 · 2020年11月25日
專知會員服務
57+閱讀 · 2020年11月3日
專知會員服務
62+閱讀 · 2020年10月24日
專知會員服務
40+閱讀 · 2020年10月11日
專知會員服務
42+閱讀 · 2020年9月3日
專知會員服務
82+閱讀 · 2020年7月27日
機器學習速查手冊,135頁pdf
專知會員服務
125+閱讀 · 2020年3月15日
【2020新書】簡明機器學習導論,電子書與500頁PPT
專知會員服務
171+閱讀 · 2020年2月7日
相關資訊
相關論文
Albert Tedja
0+閱讀 · 2020年12月15日
Andreas L Opdahl,Vimala Nunavath
0+閱讀 · 2020年12月15日
Andrei Zaharescu,Radu Horaud
1+閱讀 · 2020年12月15日
Lucas Bourtoule,Varun Chandrasekaran,Christopher A. Choquette-Choo,Hengrui Jia,Adelin Travers,Baiwu Zhang,David Lie,Nicolas Papernot
0+閱讀 · 2020年12月15日
Marco Schreyer,Chistian Schulze,Damian Borth
0+閱讀 · 2020年12月13日
Bernhard Schölkopf
9+閱讀 · 2019年11月24日
Tutorial on NLP-Inspired Network Embedding
Boaz Shmueli
4+閱讀 · 2019年10月16日
Antoine J. -P. Tixier
10+閱讀 · 2018年8月30日
Ndapa Nakashole,Raphael Flauger
3+閱讀 · 2018年6月7日
Chris Cremer,Xuechen Li,David Duvenaud
3+閱讀 · 2018年1月10日
Top