強化学習入門 - Google DeepMind の David Silver 氏による強化学習コース
Posted on 2018-09-01(土) in Reinforcement Learning
「無料でアクセスできる最高の強化学習のコース」と名高い、Google DeepMind / University College London の David Silver 氏による強化学習のコース。こちらのページから、全ての講義スライドと講義ビデオが見られる。
講義1: 強化学習入門
-
教科書
- An Introduction to Reinforcement Learning
- 直感的, このコースで参照
- Algorithms for Reinforcement Learning
- 理論, 厳密
- An Introduction to Reinforcement Learning
-
強化学習とは
- 様々な分野と関係
- 工学、機械学習、神経科学(脳の報酬システムと関係)
- 機械学習の3つの分類
- 教師あり学習、教師なし学習、強化学習
-
他の機械学習アルゴリズムとの違い
- 教師の代わりに、報酬信号しかない
- 報酬がすぐに得られるとは限らない
- 時間の概念が重要。iid (独立同分布)データではない
- エージェントが環境に影響を及ぼす→データも変わる
-
強化学習の例 …
Continue reading