強化学習における好奇心 - Speaker Deck

強化学習における好奇心 - Speaker Deck

強化学習では,環境で得られる報酬がスパースである場合,うまく学習することができない.この問題を解決するための手法として,強化学習のエージェントに「好奇心」を与える研究が注目されている.本スライドでは,深層強化学習の登場以降に発表された「好奇心」を利用した強化学習の研究をまとめた.特に主要ベンチマークであるMontezuma's Revengeで高いパフォーマンスを発揮したアルゴリズムについて詳しく解説する.また,「好奇心」による探索を報酬がスパースな場合以外の強化学習に適用した場合の最新研究についても紹介する.

3 mentions: @stealthinu
Keywords: 強化学習
Date: 2019/05/15 03:48

Referring Tweets

@stealthinu 強化学習になぜ「好奇心」を導入するか「好奇心」をどう実現するかかわかりやすく解説されてる。学習後とのKLダイバージェンスが大きいほど新しい知見ありと考えるのね。 / “強化学習における好奇心 - Speaker Deck” t.co/EJwKHmz4XF

Related Entries

Read more GitHub - pfnet-research/chainer-stylegan: Chainer implementation of Style-based Generator
2 users, 3 mentions 2019/02/28 14:18
Read more SinGANの論文を読んだらテラすごかった - QiitaQiita
1 users, 0 mentions 2019/11/15 08:21
Read more GitHub - DagnyT/GLAMpoints-PyTorch: Unofficial PyTorch implementation of GLAMpoints: Greedily Learne...
1 users, 0 mentions 2020/02/05 00:51
Read more ニューラルネットワークにおける「宝くじ仮説(Lottery Ticket Hypothesis)」 | NHN テコラス Tech Blog | AWS、機械学習、IoTなどの技術ブログ
4 users, 0 mentions 2019/07/04 23:00
Read more ELECTRA: Pre-training Text Encoders as Discriminators Rather Than Generators · Issue #1539 · arXivT...
1 users, 0 mentions 2020/03/11 03:51