海外・国内のベンチャー系ニュースサイト | TECHABLE

TECHABLE

Tech ビデオ映像の楽器の音を調整できるAIシステム「PixelPlayer」、MITが開発中

Tech

ビデオ映像の楽器の音を調整できるAIシステム「PixelPlayer」、MITが開発中

SHARE ON

このエントリーをはてなブックマークに追加
YouTubeなどで複数の楽器を使用した演奏のビデオを観るとき、特定の楽器の音をもっとよく聴きたいと思ったことはないだろうか。

そんな願望を可能にする技術を、マサチューセッツ工科大学(MIT)のコンピュータ科学・人工知能研究所(CSAIL)が開発中だ。深層学習を利用して楽器の音を聞き分け、そして各音のボリューム調整ができるAIシステム「PixelPlayer」だ。

・特定の音を抽出


たとえば、クラリネットとギターによる演奏のビデオを観るとしよう。クラリネットの音をはっきりと聴きたいというとき、PixelPlayerではクラリネットにカーソルを合わせてクリックすると、クラリネットの音が大きくなり、ギターの音が小さくなる。逆の場合もしかりだ。

ポイントは楽器の音をピクセルレベルで特定でき、そしてその音を抽出できることにある。

・ビデオ60時間分で学習


このシステムは自己教師あり深層学習を利用して開発。約60時間のビデオを“みせて”音や楽器について学習させたのだという。

その結果、現在のところ20種類の楽器を特定できるが、似ている楽器の判別などはまだ難しいとのこと。しかし使うほどに学習していくことを考えれば、対応する楽器の数は増え、また高度な聞き分けも可能になることが予想される。

いつか、音響操作ツールとしてこのテクノロジーがYouTubeなどに搭載される日がくるかも?

MIT

関連記事

Techableの最新情報をお届けします。
前の記事
次の記事

#関連キーワード


WHAT'S NEW

最新情報