猫が青色の道を通って「S」⇒「G」を目指すAI ※ 「AI (solve maze puzzles)」よりも簡易的なコードで生成されている分、学習が遅い 条件 - 赤色はなるべく通りたくない道 - 色がない場所を通ったら「S」へ戻される Q学習を用いて道筋を見つけている 「total training」で学習回数を決定する