ソフトフロントジャパンは、音声処理とリアルタイム処理技術に強みを持ち、リアルタイムコミュニケーションを実現する製品やサービスを開発・販売している企業です。その強みを生かし、最近では人との自然な会話を実現するクラウド型ロボットシステム(=ボイスボット)の研究開発にも取り組み、実現化しています。
この分野は非常にニッチな技術と捉えられてきましたが、昨今のスマートスピーカーの普及にはじまったボイスコンピューティング市場の活況により、非常に注目を浴びています。その需要に国内でいち早く目をつけ、「声を使った業務コミュニケーションの場で生じる悩みの本質をシステムで解消すること」に視点を置いて開発された当社のボイスボット「commubo(コミュボ)」は、2018年のリリースからこれまでに70社を超えるお客様にご利用いただいてきました。
実はこのcommubo、開発のきっかけからローンチに至るまで約1年半と、当時ボイスボットのボの字もない中ハイスピードで開発、販売まで至っています。
どうやって短期間での開発を実現したのか、当時の開発者、そして取締役でもある佐藤和紀に、「企画からローンチして反響を得るまで」、また「ローンチ後から導入したお客様に使い続けられるプロダクトとして成長した今に至るまで」というテーマで、前編・後編の2回に分けて話を聞きました。
開発チームと(手前真ん中:佐藤)
ボイスボットは、AIや音声認識、自然言語処理などの技術を利用し、自動での電話対応を実現するシステムです。
commuboも、代表電話、予約受付、督促業務など、コールセンターを中心とした電話業務の様々な現場で採用いただいています。
現場課題の声をきっかけに、自社保有の技術を使ったプロトタイプを2週間で開発
――そもそも、会話をするロボットに目を向けることになったのは、何がきっかけだったんでしょうか?
2017年春頃、お客様からコールセンターの現場課題を聞いたのが始まりです。『オペレーター不足で困っており、新しい人を採用しても教育をするのが大変、ロボットでどうにかならないか』というお話でした。
当時はソフトバンクPepperが発売して既に2年以上経ち、Amazon EchoやGoogle Homeも海外で発売開始されていた時代。『いまさら音声会話するだけのロボットなんて、すぐに開発できるし、腰を据えて開発するテーマではないか』と思ったものの、当時会社としても新しいアイデア・サービスを探してアンテナを張っていた時代ということもあり、せっかくなので技術調査とプロトタイプ開発だけ行うことにしました。
技術調査を始めてみると、当時世の中で「会話AI」「チャットボット」と呼ばれていたものは、人間の「はい」や「いいえ」といった単純な内容にしか対応できておらず、実際に人間が会話するような、極めて短い時間でのリアルタイム返答はできていないことがわかりました。さらにロボットの話す声(音声合成)も「いかにもロボット」のようなたどたどしい発話で、業務でお客様に対応するレベルには達していなかった。なので、当社の強みである音声処理・リアルタイム処理技術を使えば、より現場で使えるものができるし、勝機があるのではないかということがわかってきました。
そこからクラウドの音声認識・音声合成・会話AIのサービスを比較・選定し、それに自社が保有する電話技術・音声処理技術を組み合わせ、実際に電話に応答する簡単なプロトタイプを2週間で開発しました。
――プロトタイプとはいえ、一人で、2週間で開発ですか!?
はい。ただ最初のプロトタイプは、人間が話してから3~4秒後に返答するレベルのもので、とても実際の電話業務に適用できるようなレベルではありませんでした。社内でデモをしても反応はいまひとつで、誰も見向きもしない状態。
一方で僕としては『世の中の技術レベルがこの程度なのであれば、開発投資する価値はあるのでは』と考えていました。
ここから技術開発の可能性を感じながらも、リソースを確保できず本格的に開発に着手できないジレンマを抱えながら、オフィスの端に引きこもり、通常業務のかたわら一人で開発をする日々が半年ほど続きます。開発と並行して市場調査、社内外の理解を得る動きも、ほぼ一人で行っていたこの時期は、非常に苦しい時期ではありました。
開発本格稼働からローンチまでの9か月。予告動画公開へ
――その苦しい状況が変わっていったのはいつごろですか?
2018年1月、ようやく本格的に会社として開発がスタートしました。開発メンバーが2月に1人、4月にもう1人と加わり、ここから開発が加速します(写真は当時の開発チームの様子)。
僕としても、一人ではアイデアは息詰まってしまうし、人と会話して理解や思考を深めたい、考えを壁打ちしたいと感じていたので、これは非常にありがたかったです。
開発陣が充実してきた分、僕はお客さんのところを回る時間も増え、しばらくはオフィスで開発、スーツを着てお客さんを回り、プロトタイプデモを見せながらマーケットリサーチ、また戻って開発・・・を繰り返す日々が続いていました。
――メンバーが増えて、開発のスピードはさらに加速していったんですね。
さらに販売に向けての動きも加速していきます。10月1日に発売日を定め、それに向けての準備も並行していきました。
3月には製品名などの協議。特徴・機能・効果など、様々な観点で思い浮かぶキーワードをホワイトボードに書き出して、2~3日眺めながら仕事をして、絞っていて・・・最終的に、コミュニケーションロボットの略であるcommubo(コミュボ)という名前が生まれました(写真は当時の名称検討の様子)。ロゴも、commuboの技術的特徴である「聞く・考える・話す」を3色で表し、それがリアルタイムに発信され、交差していくイメージを表現しています。
販売前に出す予告動画の準備もありました。これも全部自分たちで制作していて、声もcommuboと社員で声入れを行い、iMovieで編集して・・・とすべて自分たちで、内部で制作していました。
でも、動画公開の1週間前に、ちょうどGoogleがGoogle Duplex(AIを活用した自動音声通話技術による自動予約サービス)をリリースされてしまい・・・、そのクオリティに驚き、『先越された!』と思いながらも動画を公開したんです。
動画公開が転機に。「なめらかな会話」を実現するcommuboに注目が集まる
ところがこの動画が大きな転機となりました。
公開してからものすごい反響で、発売以降も多数の引き合いをいただくようになりました。こちらから営業をかけなくてもどんどんお声がかかるので、僕も開発一本に集中できるようになり、そこからはあっという間に2018年10月の販売開始に至ります。
2019年春に出展した展示会ではブースから人があふれるくらいの反響をいただき、さらに同年11月にはASPIC(一般社団法人日本クラウド産業協会)のIoT・AI・クラウドアワードのニュービジネスモデル賞を受賞するなど、沢山の方にご評価をいただきました(写真は出展時の様子や、表彰式での佐藤)。
――この短期間でこれだけの反響を得る製品を開発できた要因はなんですか?
ソフトフロントジャパンは、それまで IP 電話を中心に、音声や映像のリアルタイム・メディア処理技術を長年培ってきており、その技術をもとにした製品、開発力を多くの通信機器メーカーや通信事業者に採用いただいてきました。その元々持っていた技術を発揮したことが、この開発のスピードにつながっていると思います。
また、commuboの特徴の一つに、人間の声を認識して、会話内容を捉え、返答を音声合成して再生する一連の処理をリアルタイムに実施することで実現する「なめらかな会話」がありますが、これにも当社技術の強みが生かされていますし、さらにこれが電話対応をするにあたって不可欠な要素になっていたと思います。
――現場課題のヒアリングから1年半、開発が本格稼働してからだと9か月間と、怒涛のスピードで開発をしてきた佐藤率いる開発チーム。
一方、それ以降の販売フェーズはまた新たな悩みを抱えることになります。そのエピソードは後編(2024年1月公開予定)にてお伝えします。
行動者ストーリー詳細へ
PR TIMES STORYトップへ