同社は、5月13日(金)まで東京ビッグサイトにて開催されている「第6回 AI・人工知能EXPO【春】」に出展。同製品群を用いたパフォーマンスなど音楽・音関連の最新技術を展示します。
音楽生成AIと音楽選曲AI
「Qosmo Music and Sound AI」のひとつが、「音楽生成AI」。指定されたジャンルや曲の特徴に沿って瞬時に作曲・MIDI信号を生成します。小節ごとに楽曲内容(テンポ・楽器など)を設定してリアルタイムに制御することも可能。生体反応や環境変化などに応じた音楽を生成できます。
2つ目は、AI DJがプレイリストを自動生成する「音楽選曲AI」。任意の音楽ライブラリーを深層学習モデルでインデックス化し、メタデータに頼らないプレイリスト生成を可能にします。
それまでに再生された楽曲の内容を踏まえて、動的にプレイリスト内容を生成・変更できるのも特徴でしょう。
音色変換AIとImg2Sound
3つ目は、入力音をリアルタイムに別の音に変える「音色変換AI」。リアルタイムAI音声処理技術で人間の声を楽器音など別の音に変換したり、エフェクトをかけたりできるといいます。学習用音源の学習モデルをSDKで事前生成し、追加学習不要であらゆる入力音を変換可能。応用の可能性が広い技術を汎用CPUで実行できます。
4つ目は、入力画像にマッチしたサウンドを選択する「Img2Sound(イメージtoサウンド)」。APIを通じてアップロードした画像に最適な環境音・楽曲を見つけます。
短時間のインデクシングを実行すれば、モデルの再学習なしで任意のサウンドライブラリーを検索可能。「画像→音楽」だけでなく「音楽→画像」「テキスト→音」などにも対応しています。
QosmoのAIを活用したWebサービス
同社は、AIを活用してさまざまな音体験を提供するWebサービスを展開中。たとえば、ユーザーが収録した音をもとにAIがヒューマンビートボックスを生成する「Neural Beatbox」。声・拍手・身近なものを叩く音などをWebカメラで収録すると、その音をドラムパートに割り当てて独特のリズムを生み出すといいます。
このほか、作品(画像)ページでスライダーを動かし、ビジュアルとサウンドの“不確実さ”を体験できる「Unsettled Music」、Google Street Viewの写真やアップロード画像に合った音を探す「Imaginary Soundscape」も提供中です。
PR TIME
株式会社Qosmo
Techable記事(Neural Beatbox)
(文・Higuchi)