• <blockquote id="immss"></blockquote>
  • 【儲建論壇(第58期)】環境模型學習——讓強化學習走出游戲

    發布者:鄭健發布時間:2021-07-12瀏覽次數:86

    報告題目:環境模型學習——讓強化學習走出游戲

    報 告 人:俞揚

    時  間:2021722上午9:00-11:00

    地  點:工科D345 線上同步(騰訊會議號:774723776)

    報告人簡介:博士,南京大學教授,國家萬人計劃青年拔尖人才。主要研究領域為機器學習、強化學習,近期專注于開放環境強化學習的理論、技術、與落地應用。獲2020 CCF-IEEE“青年科學家獎”,入選2018IEEE Intelligent Systems雜志評選的“國際人工智能10大新星”,獲2018亞太數據挖掘“青年成就獎”,受邀在IJCAI’18作關于強化學習的“青年亮點”報告。獲2013年全國優秀博士學位論文獎、2011CCF優秀博士學位論文獎。

    報告摘要:強化學習研究大多被限制在游戲環境中,尚處于“好看不好用”的境地?;诃h境模型的強化學習被認為是有望解救強化學習樣本效率低下的主要途徑。一旦有了良好環境模型,強化學習的大量試錯可在環境模型中完成,從而極大的減少了在真實環境的試錯采樣的數量,使得強化學習更具可用性。然而,以往環境模型學習的理論與實驗均難以支持這一想法,使得研究主流逐漸拋棄對學習良好環境模型的期待。報告人在實踐需求中看到,環境模型具有難以替代的應用優勢,并在環境模型學習上開展了研究。本次報告將匯報環境模型學習的研究進展,及其在真實強化學習應用中的效用。


                                                                           儲運與建筑工程學院

                                                                                                                                                                                                                            2021712


    日本特黄A级高清免费大片,免费特级婬片日本高清视频,日本无码特级毛片大全