・人工知能が20分足らずで運転を学習
「深層強化学習」とは、試行錯誤による学習を繰り返しながら報酬を最大化する行動を学習する「強化学習」と、ヒトの脳神経回路を模したニューラルネットワークを多層的することで、データに含まれる潜在的な特徴をとらえ、より正確で効率的に判断する「深層学習」を組み合わせた手法だ。
「Wayve」では、仏ルノーの小型電気自動車「Twizy」をベースに、アクセルやブレーキ、ハンドルをコンピュータ制御できるよう改造。
車内には深層強化学習アルゴリズムが動作するGPU(グラフィック処理ユニット)が搭載され、フロント部分に装着した一台のカメラから得られる画像データをリアルタイムで解析する。
このアルゴリズムの学習プロセスでは、人間のドライバーが同乗し、道からそれると“罰”として停車させられる一方、道に沿って走行できれば、人間に邪魔されることなく、より長い距離を走るという“報酬”が与えられる仕組みとなっており、試行錯誤を繰り返しながら最適な走行を学んでいく。
実験では、わずか15分から20分で、ゆるやかなカーブのある道をスムーズに走行できるようになった。
・三次元地図に依存しない自律走行を実現できる!?
現在開発中の自律走行車の多くは、高精度三次元地図による誘導システムが採用されているが、三次元地図の作成には労力がかかるだけでなく、情報を頻繁に更新する必要があり、自律走行車にも、複数のカメラやセンサーを搭載しなければならないという課題がある。
「Wayve」が開発した深層強化学習アルゴリズムは、高精度三次元地図を必要としない新たなアプローチからの自律走行車の実現可能性を示すものとして、注目されている。(文 松岡由希子)
Wayve