Aidemy 10周年

AIプログラミング学習サービス「Aidemy」、新コース「スクラッチ実装して理論を体得する強化学習」を開設

– 強化学習の基礎的な手法 –

東大発スタートアップの株式会社アイデミー(本社:東京都文京区、代表取締役CEO 石川聡彦)が提供するAIプログラミング学習サービス「Aidemy」(https://aidemy.net/)は、2018年9月28日(金)より、新たに「スクラッチ実装して理論を体得する強化学習コース」の提供を開始しましたのでお知らせいたします。

「スクラッチ実装して理論を体得する強化学習コース」概要
強化学習とは、ある特定の環境のなかで試行錯誤しながら最適な行動を発見する機械学習の手法の一つで、ゲームAIなどによく使われる手法です。本講座では、強化学習アルゴリズムをNumPyのみでスクラッチ実装しながら、強化学習のアルゴリズム理論を会得することを目標とし、最終的には簡単な迷路を強化学習で解いていきます。
なお、この講座はAidemyの他講座と異なり、アルゴリズム理論そのものを把握することに主眼を置いています。そのため、大学数学レベルの確率(条件付き確率)の知識や、高校理系数学(数学Ⅲ)の知識を前提としています。

「スクラッチ実装して理論を体得する強化学習コース」詳細
本コースでは、下記の3つの項目を重点的に学習できます。
1. 強化学習とは
強化学習における基礎的な知識と、基本的なアルゴリズムを理解、実装します。ここでは強化学習における最も単純なN腕バンディット問題」を良い報酬を得るための方策を探索しながら解説します。

2. マルコフ決定過程とベルマン方程式
「1. 強化学習とは」の復習に加えて、時間ステップやエピソードの概念を追加し、マルコフ決定過程の構成を理解します。また、状態価値関数、行動価値関数により収益の定義をした上で、最適な方策を選択する実装を行います。最適な方策をとった時の価値関数、行動価値関数をベルマン方程式を用いて定義していきます。

▲「スクラッチ実装して理論を体得する強化学習コース 報酬と収益」の画面▲

 

3. 動的計画法とTD手法

与えられたベルマン方程式を実際に解き、試行錯誤による経験によって解くための手法について説明していきます。最終的には、SarsaとQ-learningについて学びます。

■価格
3,980円(税込)

■お申し込み
「スクラッチ実装して理論を体得する強化学習コース」お申し込みページ(https://aidemy.net/courses/5040)よりお申し込みください。

プレスキットはこちら