在社會經濟生活,銀行、證券或保險業者從市場主體募集資金,並投資給其它市場主體的經濟活動。

VIP內容

強化學習(RL)作為一種可行的、強大的技術,用於解決各種複雜的跨行業業務問題,包括在不確定性下的順序優化決策。盡管RL被歸類為機器學習(ML)的一個分支,但它的看待和處理方式往往與機器學習的其他分支(監督和非監督學習)非常不同。事實上,RL似乎掌握了開啟人工智能前景的關鍵——人工智能可以根據觀察到的信息的變化來調整決策,同時不斷朝著最優結果前進。RL算法在無人駕駛汽車、機器人和策略遊戲等備受矚目的問題上的滲透,預示著未來RL算法的決策能力將遠超人類。

本書重點研究支撐RL的基礎理論。我們對這一理論的處理是基於本科水平的概率、優化、統計和線性代數。我們強調嚴謹但簡單的數學符號和公式來發展理論,並鼓勵你把方程寫出來,而不是僅僅從書中閱讀。偶爾,我們引用一些高等數學(如:隨機微積分),但本書的大部分是基於容易理解的數學。特別是,兩個基本的理論概念- Bellman最優方程和廣義策略迭代-貫穿全書,因為它們構成了我們在RL中所做的幾乎所有事情的基礎,甚至在最先進的算法中。

本書第二部分用動態規劃或強化學習算法解決的金融應用。作為隨機控製問題的許多金融應用的一個基本特征是,模型MDP的回報是效用函數,以捕捉金融回報和風險之間的權衡。

成為VIP會員查看完整內容
0
34
1
子主題
Top