・本来あるべき形を推測し、画素を追加して、よりはっきりした画像に
低解像度画像をもとに高解像度画像を生成する技術としては、従来、周辺の画素をもとに平均的な画像を埋め込んでいくことで、より完全に近い画素へと再構成する「SISR」が知られている。
しかし、この技術は、ぼけた画像をシャープにみせることはできないのが難点であった。
一方、「EnhanceNet-PAT」は、あるパターンや材質を表す画像をサンプルとし、これらと視覚的に類似した形・大きさの新しい画像を自動的に合成する、いわゆる“テクスチャ合成”のためのアルゴリズムだ。
機械学習(ML)により、サンプルとなる多数の低解像度画像を高解像度に変換させたのち、変換画像と元の高解像度画像と比べて、その違いを認識させることによって、画像が本来映すべき物体の形や大きさなどを学ばせた。
その結果、たとえば、鳥を映した低解像度画像から、本来の鳥の形状を推測し、必要な画素を自動で追加して、より輪郭がはっきりとした鳥の画像を生成できるようになったという。
・人工知能がより“リアル”なビジュアルを生成
人工知能とデジタルフォトグラフィーを組み合わせることによって、より“リアル”な画像を創り出す「EnhanceNet-PAT」は、画像処理の分野にも、少なからず影響をもたらすかもしれない。(文 松岡由希子)
Max-Planck-Instituts für Intelligente Systeme