リアルタイムで高音質な音声合成を実現
スマートスピーカーやボーカロイドなどが実用化され、発展著しい印象を受ける音声処理技術。一方で、画像処理技術と比べると限定的な用途にとどまっており、産業用途も含めた幅広い領域での活用事例には乏しいのが実情だ。その理由の一例として、現状の技術では厳密なリアルタイム性を実現できないことが挙げられるという。ネフロックが今回行う研究では、リアルタイムで高音質な音声合成を実現すべく、FPGAを用いた音声合成AIチップを開発する。
FPGAは「Field Programmable Gate Array」の略語で、製造後に回路の書き換えを行える集積回路の一種だ。その特性を活用し、ユーザーのカスタム開発を可能にする仕組みを設けることで、音声合成実用化の促進を目指す。
東工大発のベンチャーであるネフロックの取り組み
2011年に創業されたネフロックは、東工大発ベンチャーとして、大岡山キャンパス近くに拠点を構える。主な事業領域は、ディープラーニングを用いた人工知能の研究開発やシステム構築だ。また、自社開発の各種AIエンジンを保有しており、矯正メガネを着用したまま他のメガネを試着できる画像処理技術「MEGANE on MEGANE」などを提供中。
「テクノロジーで世の中をもっと楽しくする」というビジョンを掲げ、先進的な取り組みを続ける同社の今後に期待したい。
PR TIMES
(文・早川あさひ)