特許の出願を行いました。

DQN

強化学習(DQN)

3-4. DQNでスーパーマリオ1-1をクリアする(動作確認編)

やること DQNでマリオをクリアします。9-3ではGAでマリオをクリアしましたが、あれはいわば「目を閉じて走り、ジャンプのタイミングを最適化」しているに過ぎません。ここではきちんと画面を見て、...
強化学習(DQN)

3-3. DQNで難しい迷路を解く

やること 前回はDQNで地雷原を進むゲームを解きました。今回は、もっと賢く行動するためにニューラルネットを工夫してみます。 使うもの ニューラルネットを工夫す...
強化学習(DQN)

3-2. DQNで迷路を解く

やること DQNのプログラムは非常に高度ですが、勉強会で配布されたコードは比較的シンプルで読み解きやすいです。今日は、DQNで地雷原を進むゲームを解いてみましょう。 環境とコード ...
強化学習(DQN)

3-1. 強化学習とQ学習とDQN

やること 機械学習は、教師あり学習、教師なし学習、強化学習の3つに分けて語られることが多いです。強化学習は、「長期的な価値が高くなるような判断基準を見つける」感じの学習です。今日は、強化学習の...
タイトルとURLをコピーしました