!!! サイト改修中のため表示が乱れる場合があります(1月末頃まで) !!!

強化学習

強化学習

Car-racing game “vcracing” tutorial

vcracingOverviewYou can drive it manually, and also with machine learning. "vcracing" is a car-racin...
強化学習

レーシングゲーム「vcracing」チュートリアル

English available.vcracing、爆誕概要手動で運転してもよし、機械学習で運転してもよし。「vcracing(ぶいしーれーしんぐ)」は機械学習向けレーシングゲームです。OpenAI...
強化学習

3-4. DQNでスーパーマリオ1-1をクリアする(動作確認編)

やることDQNでマリオをクリアします。9-3ではGAでマリオをクリアしましたが、あれはいわば「目を閉じて走り、ジャンプのタイミングを最適化」しているに過ぎません。ここではきちんと画面を見て、進み方を学...
強化学習

3-3. DQNで難しい迷路を解く

やること前回はDQNで地雷原を進むゲームを解きました。今回は、もっと賢く行動するためにニューラルネットを工夫してみます。 使うものニューラルネットを工夫する前回畳み込み層のカーネルが5*5でした。つま...
強化学習

3-2. DQNで迷路を解く

やることDQNのプログラムは非常に高度ですが、勉強会で配布されたコードは比較的シンプルで読み解きやすいです。今日は、DQNで地雷原を進むゲームを解いてみましょう。 環境とコードゲームのルールできるだけ...
強化学習

3-1. 強化学習とQ学習とDQN

やること機械学習は、教師あり学習、教師なし学習、強化学習の3つに分けて語られることが多いです。強化学習は、「長期的な価値が高くなるような判断基準を見つける」感じの学習です。今日は、強化学習の基本である...