4/15(水)～17(金)　NexTech Week＠ビッグサイトに出展します☆彡

遺伝的アルゴリズム vcopt

9-20. 遺伝的アルゴリズム（vcopt）でOpenAI Gym “CarRacing-v0″ に挑戦

未分類

2020/05/06

目次

やること
結果だけどうぞ
感想

やること

9-19ではGoogle ColaboratoryでOpenAI Gymの「CarRacing-v0」を実行し、最後に遺伝的アルゴリズムでプレイした例をお見せしました。

最適化アルゴリズムはこちらの記事のものを改変して使っています。

ここではいくつかのステージで、遺伝的アルゴリズム（GA）を使って最適化を行ってみます。

結果だけどうぞ

コース１

先の記事でもこのコースを走りました。

コース２

やったぜ。

コース３

直線が続くと調子に乗るみたいです。

コース４

えぇ・・・

コース５

安全第一。素晴らしいです。

コース６

out-in-out・・・ではないですね。

感想

デフォルトのコードでは、env.step() の返り値に含まれる有益な情報は報酬しかありませんでした。これは改造後も変わっていません。報酬だけでは最適化にも限界があるので、さらに改造して道路情報なども得られるようにしたいです。

タイトルとURLをコピーしました