2017年にはBrainGateが、8語/分の速度で脳から直接単語を入力して記録を打ち立てた同技術だが、このほどカリフォルニア大学の研究者らが新手法により平均150語/分を達成。自然な会話の速度を実現した。
新手法では、ニューラルネットワークにより運動野や感覚野の活動をモデル化して音声に変換する。
・唇や舌の動きを音声に変換
電極を言語を発するとき活動する脳の領域に設置して、直接信号を音声に変換しようというのがBCIでのこれまでの試みだったが、どうやらこれは非常にむつかしいことがわかってきた。また、Facebookは脳に電極を挿すことなく100語/分で発話できるシステムを開発しようとしているが、専門家によると外部電極では脳から正確なデータを得ることができないという。
そこで研究者らは、運動野および感覚野の活動に焦点をあてた。新手法では、まず脳の活動を読み取り、唇や舌、アゴや喉などの動きと合わせる。最終的には脳の信号から発声器官の動きを再現して音声を再構築する。
・約7割の単語を正しく認識
研究者らは、患者が数百の文章を声に出して話すときの脳の信号を記録した。そして、ニューラルネットワークにより唇や舌の動きなど発声器官に応じたモデルを作成。デジタルの表現から音声を合成した。これらを聞き取ったところ、全体として約7割の単語が正しく認識できたとのこと。
また、ある参加者が音を出さずに文章を読んだところ、わかりやすい発話に合成でき、ここで作成されたモデルは、他の人でも活用できた。これは人が変わるごとにディープラーニングをおこなう必要がない可能性を示唆している。
将来的には言語障害のある被験者についても同技術が活用できるよう研究が進められる計画だ。
参照元:Brain Implant Can Say What You’re Thinking/IEEE Spectrum