"> 【如何做研究】How to research ,22頁ppt - 專知VIP

來自中國科學技術大學 計算機與科學與技術學院 周正陽關於《如何做研究》的心得

成為VIP會員查看完整內容
0
73
1

相關內容

Google 研究科學家Mathieu Blondel在PSL大學的“機器學習的對偶性”課程材料。主題包括共軛函數,平滑技術,Fenchel對偶性,Fenchel-Young損失和塊對偶坐標上升算法。

http://mblondel.org/teaching/duality-2020.pdf

成為VIP會員查看完整內容
0
27
0

來自深度學習數學夏季學校2020的第二節課:深度神經網絡,介紹了深度學習曆史、神經網絡等知識點。

成為VIP會員查看完整內容
0
33
0

來自DeepMind研究人員Feryal Behbahani, Matt Hoffman 和 Bobak Shahriari講解的強化學習教程。

成為VIP會員查看完整內容
0
72
1

本文為大家帶來了一份斯坦福大學的最新課程CS234——強化學習,主講人是斯坦福大學Emma Brunskill,她是斯坦福大學計算機科學助理教授,任職斯坦福大學人類影響力實驗室、斯坦福人工智能實驗室以及統計機器學習小組,主要研究強化學習。要實現人工智能的夢想和影響,需要能夠學會做出正確決策的自主係統。強化學習是這樣做的一個強有力的範例,它與大量的任務相關,包括機器人、遊戲、消費者建模和醫療保健。本課程通過講課、書麵作業和編碼作業的結合,學生將精通強化學習的關鍵思想和技術。

1.課程介紹(Description)

要實現人工智能的夢想和影響,需要能夠學會做出正確決策的自主係統。強化學習是這樣做的一個強有力的範例,它與大量的任務相關,包括機器人、遊戲、消費者建模和醫療保健。本課程將為強化學習領域提供紮實的介紹,學生將學習包括通用化和探索在內的核心挑戰和方法。通過講課、書麵作業和編碼作業的結合,學生將精通強化學習的關鍵思想和技術。作業將包括強化學習和深度強化學習的基礎,這是一個極有前途的新領域,將深度學習技術與強化學習相結合。此外,學生將通過期末專題來增進對強化學習領域的理解。

課程地址:

https://web.stanford.edu/class/cs234/schedule.html

2.預備知識(Prerequisites)

1)熟練Python

所有的課程都將使用Python(使用numpy和Tensorflow,也可以使用Keras)。這裏有一個針對那些不太熟悉Python的人的教程。如果你有很多使用不同語言(如C/ c++ / Matlab/ Javascript)的編程經驗,可能會很好。

2)大學微積分,線性代數(如 MATH 51, CME 100)

你應該能夠熟練地進行(多變量)求導,理解矩陣/向量符號和運算。

3)基本概率及統計(例如CS 109 或同等課程)

你應該了解基本的概率,高斯分布,均值,標準差等。

4)機器學習基礎

我們將闡述成本函數,求導數,用梯度下降法進行優化。CS 221或CS 229均可涵蓋此背景。使用一些凸優化知識,一些優化技巧將更加直觀。

3.主講:Emma Brunskill

Emma Brunskill是斯坦福大學計算機科學助理教授,任職斯坦福大學人類影響力實驗室、斯坦福人工智能實驗室以及統計機器學習小組。

主要研究強化學習係統,以幫助人們更好地生活。並處理一些關鍵技術。最近的研究重點包括:1)有效強化學習的基礎。一個關鍵的挑戰是要了解代理商如何平衡勘探與開發之間的局限性。2)如果要進行順序決策,該怎麼辦。利用巨大數量的數據來改善在醫療保健,教育,維護和許多其他應用程序中做出的決策,這是一個巨大的機會。這樣做需要假設/反事實推理,以便在做出不同決定時對潛在結果進行推理。3)人在回路係統。人工智能具有極大地擴大人類智能和效率的潛力。我們正在開發一個係統,用其他眾包商(CHI 2016)生產的(機器)固化材料對眾包商進行訓練,並確定何時擴展係統規格以包括新內容(AAAI 2017)或傳感器。我們也有興趣研究確保機器學習係統在人類用戶的意圖方麵表現良好(Arxiv 2017),也被稱為安全和公平的機器學習。

個人主頁:https://cs.stanford.edu/people/ebrun/

4.課程安排

01: 強化學習導論(Introduction to Reinforcement Learning)

02: 表格MDP規劃(Tabular MDP planning)

03: 表格RL政策評估(Tabular RL policy evaluation)

04: Q-learning

05: 帶函數逼近的強化學習(RL with function approximation)

06: 帶函數逼近的強化學習(RL with function approximation)

07: 帶函數逼近的強化學習(RL with function approximation)

08: 從馬爾可夫決策過程到強化學習(Policy search)

09: 從馬爾可夫決策過程到強化學習(Policy search)

10: 課堂中期(In-class Midterm)

11: 模仿學習/探索(Imitation learning/Exploration)

12: 探索/開發(Exploration/Exploitation)

13: 探索/開發(Exploration/Exploitation)

14: 批處理強化學習(Batch Reinforcement Learning)

15: 嘉賓講座:Craig Boutilier(Guest Lecture: Craig Boutilier)

16: 課堂測驗(In-class Quiz)

17: 蒙特卡洛樹搜索算法(Monte Carlo Tree Search)

18: 牆報展示(Poster presentations)

成為VIP會員查看完整內容
0
55
2
小貼士
相關主題
相關VIP內容
專知會員服務
29+閱讀 · 2月12日
專知會員服務
26+閱讀 · 2020年11月30日
專知會員服務
27+閱讀 · 2020年11月29日
專知會員服務
20+閱讀 · 2020年10月9日
專知會員服務
33+閱讀 · 2020年8月19日
【ST2020硬核課】深度學習即統計學習,50頁ppt
專知會員服務
54+閱讀 · 2020年8月17日
專知會員服務
72+閱讀 · 2020年8月7日
專知會員服務
26+閱讀 · 2020年7月27日
專知會員服務
55+閱讀 · 2020年1月15日
相關資訊
下載 | 524頁中文教程《動手學深度學習》
機器學習算法與Python學習
4+閱讀 · 2018年11月30日
220頁深度神經網絡基礎、理論與挑戰PPT【下載】
機器學習算法與Python學習
4+閱讀 · 2018年9月12日
資源 | 深度學習進階視頻課程+完整PPT
AI研習社
5+閱讀 · 2018年9月1日
【機器視覺】如何做好計算機視覺的研究?
產業智能官
4+閱讀 · 2017年10月19日
相關論文
Giovanni Colavizza
0+閱讀 · 6月5日
Shang-Hua Gao,Qi Han,Zhong-Yu Li,Pai Peng,Liang Wang,Ming-Ming Cheng
5+閱讀 · 1月4日
Xin Chen,Lingxi Xie,Jun Wu,Longhui Wei,Yuhui Xu,Qi Tian
7+閱讀 · 2020年12月15日
Auto-GNN: Neural Architecture Search of Graph Neural Networks
Kaixiong Zhou,Qingquan Song,Xiao Huang,Xia Hu
4+閱讀 · 2019年9月10日
Fréderic Godin,Anjishnu Kumar,Arpit Mittal
3+閱讀 · 2019年2月26日
Panoptic Feature Pyramid Networks
Alexander Kirillov,Ross Girshick,Kaiming He,Piotr Dollár
3+閱讀 · 2019年1月8日
IRLAS: Inverse Reinforcement Learning for Architecture Search
Minghao Guo,Zhao Zhong,Wei Wu,Dahua Lin,Junjie Yan
4+閱讀 · 2018年12月14日
Thomas Elsken,Jan Hendrik Metzen,Frank Hutter
10+閱讀 · 2018年9月5日
Feature Selection Library (MATLAB Toolbox)
Giorgio Roffo
3+閱讀 · 2018年8月6日
Top