・模倣音声で議論も
同社のサイトでは、サンプルとしてアメリカのトランプ大統領、オバマ前大統領、ヒラリー・クリントン氏のコピー音声による議論を公開している。
それを聞くと、会話は機械的なところがあり若干ぎこちないものの、各氏の声の特徴をよく捉えている。知らされなければ「模倣してマシーンでつくられた声」と気づかない人もいるのではないかと思わせるレベルだ。
・たったの1分で特徴を収集
このアルゴリズム、モントリオール大学のラボで開発されたディープラーニニング(ニュートラルネットワークを用いた機械学習)をベースに構築された。1分ほど“本当の声”を聞かせて声の特徴を集め、そのデータをキーに変換して音声をつくるのだ。
社名のLyrebirdは日本語で「ココドリ」という鳥の名称。ココドリが他の鳥の声や、あらゆる音を上手に真似ることにちなんでいる。
・オーディオブックに活用?
もちろん、声の模倣というのは、倫理的な危うさをはらんでいる。最近では、指紋同様に声を生体認証として使うサービスも開発されているだけに、悪用の可能性を指摘する声もでてきそうだ。
この点について、Lyrebirdは「この技術を一般公開し、誰でも使えるようにすることで、声はコピーできるものととらえてもらう」としている。また、技術の実用化としては、オーディブックやスピーチアシスタント機能などへの活用を想定しているようだ。
声をコピーできるとはなんとも不思議な感じがするが、興味のある人はまずはサンプルを聴いてほしい。
Lyrebird