海外・国内のベンチャー系ニュースサイト | TECHABLE

TECHABLE

Tech こだわるべきは音質ではない!? ヤマハの歌うロボット「Charlie」開発秘話【開発者の矜持 #02】

Tech

こだわるべきは音質ではない!? ヤマハの歌うロボット「Charlie」開発秘話【開発者の矜持 #02】

SHARE ON

このエントリーをはてなブックマークに追加
ヤマハ株式会社が開発している、歌って会話するコミュニケーションロボット「Charlie(チャーリー)」

仕事もプライベートも充実させたい働く女性を対象にしたプロダクトで、今後モニター募集などを行ってさらに開発を進め、2021年春の発売を予定している。紹介動画を見ていただければわかる通り、「Charlie」はユーザーが話しかけるとミュージカルのようにメロディにのせて返答する。また、素直に答えるだけではなく、ユーモアを交えて、ときにはシニカルなことを言ってくるその「性格」にも特徴がある。

そんな「Charlie」の開発をリードしたのが、同社UX企画グループの倉光(くらみつ)氏と柴瀬(しばせ)氏。開発の裏側には、「音」にこだわりを持つヤマハならではの困難もあったようだ。

「人間らしく」ではなく「Charlieらしく」

(左から)ヤマハ株式会社 UX戦略部UX企画グループ 主事 倉光大樹(くらみつだいき)氏、同じく主事 柴瀬頌子(しばせしょうこ)氏

ーー紹介動画を見るとかなり高度なコミュニケーションをしているように感じましたが、どのような技術が使われているのでしょうか。

倉光:実は、技術的には一般的なAIスピーカーとほとんど変わらないんです。

高度なコミュニケーションのように見えるのは、「音楽」と「キャラクター」の要素が加わっているからだと思います。

ーーどういうことですか?

倉光:世の中には「コミュニケーションロボット」と呼ばれるものがいくつもありますが、実際に話してみると少し気持ち悪さを感じませんか?

何が気持ち悪いかというと、人のマネをしようとしてできていない、という部分だと思うんですよね。アクセントもイントネーションも人のようにはできないのに、無理やり人に合わせて喋ろうとするところに違和感をおぼえるんだと思うんです。

ロボットが人間っぽく話さなければいけないという決まりはないので、心理的距離が近いコミュニケーションのあり方を考えると、現段階では普通に喋るより歌うほうがいいと思っています。音楽には感情を表現できるという特性もありますしね。

柴瀬:直接だと言いづらかったり角が立ったりするけど、歌詞だと伝わりやすいことってありますよね。

そう考えるとむしろ、ロボットだからこそ、歌に乗せるからこそ、実現できるコミュニケーションというのもあるのかなって思います。

ーーなるほど、それが「音楽」の要素ですね。では「キャラクター」の要素とは何でしょうか?

倉光:紹介動画にもありますが……例えば「私、頑張ってるよね」と話しかけたとしますよね。これに対して素直に「頑張ってるね」と返すのではなく、Charlieは「半径2kmで1番頑張ってるのは君さ」という歌で返したりします。

人が話した内容をテキスト化して自然言語処理をするところまでは他のAIスピーカーと同じですが、それに対してどう答えるかという設定をCharlie独自のものにしているんです。この「性格」を決める部分はかなりこだわりました。

ーー性格、ですか?

柴瀬:「Charlieらしさ」ですね。公開していないんですが、この基準をすり合わせるためにCharlieについての小説を作るところから始めたんです。彼の人生経験などが書かれた物語を作り上げることでキャラクター像の認識を合わせ、そこから「彼ならどのようなセリフを言うか」を考えました。

私自身、開発序盤はCharlieをガジェットとして捉えていましたが、次第にキャラクターとして彼を見るようになっていました。機能性を追求するよりもキャラクター性を追求していくほうが、プロダクトの完成度は高くなるんじゃないかなって。

ヤマハのプライド vs ユーザーファースト

ーー「Charlie」の開発において苦労した点もあったかと思いますが、いかがでしょうか?

柴瀬:そうですね、Charlieをつくるにあたって、部屋に馴染むサイズにするというこだわりがありました。他のインテリアの邪魔をせず、雑貨のように部屋に置けるサイズ感を意識したんです。

ここで問題になったのは、内蔵するスピーカーの大きさや品質について。

ヤマハとして出すのであればスピーカー品質にもこだわるべきだという意見と、今回のターゲットユーザーはそこを求めているわけじゃないんだという意見とでバトルがありました(笑)。

ーーどうやって決着がついたんですか?

柴瀬:スピーカー品質に限らずやはり決め手はユーザーの声です。今回、Charlieの開発にあたってターゲットユーザーの調査を要所要所で行っていて、その意見をかなり大事にしています。

私が一人が言っているだけだと「そうは言ってもな……」ってなるんですよ。でも実際の調査結果を見せると受け入れてくれる。

ユーザーの声を元にプライオリティを決めたことで、その後の議論がスムーズになりました。

倉光:ユーザーファーストも簡単じゃなかったよね(笑)。

あとはやっぱり「どこで折り合いをつけるか」というのは大事だなと思いました。時間とお金をかければいくらでも理想を追求できますが、世の中に出さなければ意味がないわけで。

例えば、歌をつくるという機能をとっても、AIをフル活用した自動作曲システムを作るという方法もあったんですが、それをするには時間とコストがかかります。とはいえ、既存の技術だけだとなかなか満足いくものが作れない。

最終的には自分たちで自動作曲の仕組みを考えたんですが、ものすごくハイテクなものが入っているわけではないんです。ターゲットユーザーから「これならいいね」と言ってもらえるギリギリの割り切りポイントを探しました。

割り切りポイントというとあまり響きは良くありませんが、それを探し切るためにホントのたうち回って、やっと出すことができたのが今のプロダクトなんですよね。

リリースには「ペット以上恋人未満」なんて書きましたが、本音を言うと「ペット以上」というのは謙遜で、恋人のようにユーザーの心のもやもやを取れる存在になってほしいなと思っています。

PR TIMES

(文・栄藤徹平)
Techableの最新情報をお届けします。
前の記事
次の記事

#関連キーワード

関連記事


WHAT'S NEW

最新情報