海外・国内のベンチャー系ニュースサイト | TECHABLE

PRESENTED BY MashMedia

TECHABLE

Tech トランプ氏の演説も作れてしまう⁉︎1分間聞かせるだけで声をコピーできるアルゴリズムを開発

Tech

トランプ氏の演説も作れてしまう⁉︎1分間聞かせるだけで声をコピーできるアルゴリズムを開発

人によって表情や性格、考え方が違うように、声にもそれぞれ特徴がある。固有のものだと思われてきた声だが、1分間聞かせるだけで声をコピーできるアルゴリズムをカナダ・モントリオールのスタートアップ「Lyrebird」が開発した...

SHARE ON

このエントリーをはてなブックマークに追加
fullsizeoutput_294c人によって表情や性格、考え方が違うように、声にもそれぞれ特徴がある。固有のものだと思われてきた声だが、1分間聞かせるだけで声をコピーできるアルゴリズムをカナダ・モントリオールのスタートアップ「Lyrebird」が開発した。

・模倣音声で議論も


同社のサイトでは、サンプルとしてアメリカのトランプ大統領、オバマ前大統領、ヒラリー・クリントン氏のコピー音声による議論を公開している。

それを聞くと、会話は機械的なところがあり若干ぎこちないものの、各氏の声の特徴をよく捉えている。知らされなければ「模倣してマシーンでつくられた声」と気づかない人もいるのではないかと思わせるレベルだ。

・たったの1分で特徴を収集


このアルゴリズム、モントリオール大学のラボで開発されたディープラーニニング(ニュートラルネットワークを用いた機械学習)をベースに構築された。1分ほど“本当の声”を聞かせて声の特徴を集め、そのデータをキーに変換して音声をつくるのだ。

社名のLyrebirdは日本語で「ココドリ」という鳥の名称。ココドリが他の鳥の声や、あらゆる音を上手に真似ることにちなんでいる。

・オーディオブックに活用?


もちろん、声の模倣というのは、倫理的な危うさをはらんでいる。最近では、指紋同様に声を生体認証として使うサービスも開発されているだけに、悪用の可能性を指摘する声もでてきそうだ。

この点について、Lyrebirdは「この技術を一般公開し、誰でも使えるようにすることで、声はコピーできるものととらえてもらう」としている。また、技術の実用化としては、オーディブックやスピーチアシスタント機能などへの活用を想定しているようだ。

声をコピーできるとはなんとも不思議な感じがするが、興味のある人はまずはサンプルを聴いてほしい。

Lyrebird
Techableの最新情報をお届けします。
前の記事
次の記事

#関連キーワード


WHAT'S NEW

最新情報