深度強化學習 (DRL) 是一種使用深度學習技術擴展傳統強化學習方法的一種機器學習方法。 傳統強化學習方法的主要任務是使得主體根據從環境中獲得的獎賞能夠學習到最大化獎賞的行為。然而,傳統無模型強化學習方法需要使用函數逼近技術使得主體能夠學習出值函數或者策略。在這種情況下,深度學習強大的函數逼近能力自然成為了替代人工指定特征的最好手段並為性能更好的端到端學習的實現提供了可能。

VIP內容

摘要: 移動邊緣計算是近年出現的一種新型網絡計算模式,它允許將具有較強計算能力和存儲性能的服務器節點放置在更加靠近移動設備的網絡邊緣(如基站附近),讓移動設備可以近距離地卸載任務到邊緣設備進行處理,從而解決了傳統網絡由於移動設備的計算和存儲能力弱且能量較有限,從而不得不耗費大量時間、能量且不安全地將任務卸載到遠方的雲平台進行處理的弊端。但是,如何讓僅掌握局部有限信息(如鄰居數量)的設備根據任務的大小和數量選擇卸載任務到本地,還是在無線信道隨時間變化的動態網絡中選擇延遲、能耗均最優的移動邊緣計算服務器進行全部或部分的任務卸載,是一個多目標規劃問題,求解難度較高。傳統的優化技術(如凸優化等)很難獲得較好的結果。而深度強化學習是一種將深度學習與強化學習相結合的新型人工智能算法技術,能夠對複雜的協作、博弈等問題作出更準確的決策,在工業、農業、商業等多個領域具有廣闊的應用前景。近年來,利用深度強化學習來優化移動邊緣計算網絡中的任務卸載成為一種新的研究趨勢。最近三年來,一些研究者對其進行了初步的探索,並達到了比以往單獨使用深度學習或強化學習更低的延遲和能耗,但是仍存在很多不足之處。為了進一步推進該領域的研究,文中對近年來國內外的相關工作進行了詳細地分析、對比和總結,歸納了它們的優缺點,並對未來可能深入研究的方向進行了討論。

http://www.jsjkx.com/CN/10.11896/jsjkx.200800095

成為VIP會員查看完整內容
0
13
0

最新論文

Validating the safety of autonomous systems generally requires the use of high-fidelity simulators that adequately capture the variability of real-world scenarios. However, it is generally not feasible to exhaustively search the space of simulation scenarios for failures. Adaptive stress testing (AST) is a method that uses reinforcement learning to find the most likely failure of a system. AST with a deep reinforcement learning solver has been shown to be effective in finding failures across a range of different systems. This approach generally involves running many simulations, which can be very expensive when using a high-fidelity simulator. To improve efficiency, we present a method that first finds failures in a low-fidelity simulator. It then uses the backward algorithm, which trains a deep neural network policy using a single expert demonstration, to adapt the low-fidelity failures to high-fidelity. We have created a series of autonomous vehicle validation case studies that represent some of the ways low-fidelity and high-fidelity simulators can differ, such as time discretization. We demonstrate in a variety of case studies that this new AST approach is able to find failures with significantly fewer high-fidelity simulation steps than are needed when just running AST directly in high-fidelity. As a proof of concept, we also demonstrate AST on NVIDIA's DriveSim simulator, an industry state-of-the-art high-fidelity simulator for finding failures in autonomous vehicles.

0
0
0
下載
預覽
Top