今回は、音声解析AI電話「MiiTel」を提供する株式会社RevComm 執行役員リサーチディレクターの橋本泰一氏に音声DXとはどんなものか、そしてAIによる“コミュニケーションの質の見える化”がビジネスにもたらすことについて、ご寄稿いただきました。
DX実現の下準備「デジタル化」
近年はDX(デジタルトランスフォーメーション)という言葉を多く見かけるようになりましたが、DXの定義は使う人によって異なります。
本稿では、DXを「デジタル技術を人々の生活の中に浸透させ、既存の価値観や枠組みを根底から覆すイノベーション」という意味で使用します。
DXを実現するためには、いくつかのステップを経る必要があります。最初のステップは、デジタル化(Digitization:アナログ・物理データのデジタルデータ化)です。
紙で保管している書類をデータでコンピュータ内に保管するといったことが例として挙げられます。
ただ単に書類をデータとして保存するだけでは意味がないため、次にデジタライゼーション(Digitalization:個別の業務・製造プロセスのデジタル化)というステップに進みます。データ化された書類がクラウド上に保管される、検索できるなど、他者との共有を可能にすることがポイントです。
このように情報がデータ化され、その上で情報の共有が可能になって初めて、DXの下地ができあがります。
「AI」がDXのカギ
当社は、データ化された膨大な情報をもとに、新たなビジネスや仕組みを創出することこそがDXであると考えています。その膨大な情報から破壊的なイノベーションを生み出すための鍵が「AI」です。
これまでDXの対象となるものは書類や写真などの目に見える静的で物理的なものが中心でした。しかし、目に見えない音声やその場限りの活動をデータ化し活用するというコンセプトに注目が集まりつつあります。
最近でこそドライブレコーダーの映像が事故の際の検証に用いられ、保険会社に提出されるといった状況が一般化しつつありますが、5年前の時点では一般的ではありませんでした。
同じように音声、例えばコールセンターでは以前から「お客様対応の品質向上のため録音させていただきます」とアナウンスが流れて、会話を録音することは行われていました。
しかし、実際にその録音データを自在に活用できていたわけではありません。コロナ禍により電話営業や会議などのビジネス活動がオンライン化し、ビジネスにおける音声や動画がデータとして記録されること、つまりビジネス活動のデジタル化が加速しています。
また、近年の音声認識器の性能は飛躍的に向上しています。人間の音声の認識精度は約95%程度と言われていますが、現在の音声認識器は95%以上の認識精度を出すことが可能であることが研究結果として報告されており、その精度は年々向上している状況です。
音声認識器を活用し音声データをテキスト化(文字起こし)することで、会話内容を容易に共有できるようになりました。これは、音声のデジタライゼーションが実現し、“音声DX”のスタートラインに立ったことを意味します。
音声DXとは、音声データおよび文字起こしにAIを活用し、今までになかった新しい価値を創造することです。今、当社が音声解析AI電話「MiiTel」「MiiTel for Zoom」の提供を通じて行っているのは“コミュニケーションの質の見える化”という音声DXです。
「データからコミュニケーションの良し悪しを明らかにする」→「その結果を受けてコミュニケーションの方法を改善する」→「これまでやってきたコミュニケーションとはまったく違うアプローチが生まれる」といった価値を生み出しています。。
これまでまったくなかったと言っても過言ではない、新しいことを実践しています。
音声AIが人を成長させ、DXを実現する
これまで具現化しているAIとして、入力業務を自動化するといった「人間と同じことを自動でできるAI」と、人間が持てないほど重いものを持てるといった「人間を拡張させるパワードスーツのようなAI」が挙げられます。
当社はその先に、三つ目のAI「人間を成長させるAI」があると考えています。具体的には、AIがさまざまな視点から情報を分析評価し、人間に示唆やアドバイスを与えてくれるというものです。
今、当社が取り組んでいる「MiiTel」や「MiiTel for Zoom」は、人を成長させるプロダクトです。これらによって、音声DXを実現できると考えています。
AIが人間を観測し、コミュニケーション改善を支援
子どもが友達を傷つける発言をすると、親や先生が「そういう言い方をしてしまうと、お友達が悲しむよね」とアドバイスし、気づきを与えるといった場面があります。
当社が取り組んでいる音声DXは、AIが話し方、表情、態度などを精緻に分析し、AIが「今の言い方をこんな風に言い換えるともっとよくなるよ」と教えるというものです。
このような示唆を与えるために、AIは私たち人間からさまざまなことを観測します。一つ目は、声の大きさ、声の高さ、音色、抑揚、韻律、話速など「音声による空気の振動からわかる音声特徴量」です。
二つ目は、文字起こしされたテキストからわかる話し方です。わかりやすい説明、言葉遣い、敬語の利用、相手の質問に対する適切な答え、言い淀みの回数などがそれに当たります。
三つ目は、表情や音声から推測される心的変化です。例えば、喜怒哀楽の感情、理解・不理解、納得・不満などの人が感覚的に察知している情報です。音声感情認識においては、すでに約80%近い精度で感情を推定できることが報告されています。
こういった情報をAI技術により見える化し、コミュニケーションの良し悪しや改善点を明らかにすることができます。
特に社会人になると、大人が大人にアドバイスすることは、年代、ジェンダー、カルチャーギャップなどバックグラウンドの違いから、受け入れ難い場合があります。
また、セクハラ、モラハラ、アカハラなど人と人とのコミュニケーションの中で人を傷つけることが大きな問題になる世の中です。大人になったとしても、コミュニケーションの仕方についてもっと学ばなければならないでしょう。
人間は主観的な存在なので、基本的には自身の知識や経験からのアドバイスや指導が主となってしまいます。そのため、大きな勘違いや他人との認識のギャップが生まれます。
一方、第三者であるAIが膨大な分析データを基に客観的なアドバイスを与えると、その客観性から、受け入れられる可能性が高いでしょう。
つまり、「人を成長させるAI」の存在によって自己学習(セルフコーチング)し、人間はこれまで以上に成長できる存在になれるのです。
AIの助けにより人が人を想う社会を創る
RevCommの創業者である會田武史氏は、日本社会では「何を言ったか」ではなく「誰が言ったか」が優先される点にコミュニケーションコストの高さを感じていました。そこに一石を投じることで日本企業の生産性を飛躍的に向上させようと考え、「MiiTel」の着想に至りました。
ビジネスにおいて意思決定に向けたコミュニケーションのプロセスが不透明であることによって「意思決定のスピードが遅くなる」「会議で合意していた事項が突然裏返る」といったことが起こってしまいます。その不透明さをなくして透明にし、見える化することによって、健全なビジネス活動につなげていくことが可能です。
日本企業におけるコミュニケーションコストを下げ、そのことによって生産性を高め、さらに世界における競争力向上に貢献。コミュニケーションが見える化されることで、ビジネスパーソン一人ひとりが、AIの助けを借りながらより適切なコミュニケーションを実現。これにより、議論の中身はよりシンプルかつ本質的になり、“思いが正しく伝わるコミュニケーション”に近づくのではないでしょうか。
ビジネスにおいては先輩と後輩、上司と部下、プロバイダーとカスタマーなど、立場の違いによって委縮して言いたいことを言えなかったり、あるいは逆に言い過ぎてしまったりするなどの経験をした人は少なくないでしょう。
このような不本意なコミュニケーションを極力少なくすることで、ビジネスの世界においてもっと「人が人を想うこと」ができるのではないでしょうか。
ビジネス最前線の音声データを保有するRevComm
当社が営業における会話や面談に重きを置いているのは、会話が行われる場面を限定することにより、解析精度をできる限り高めたいという考えからです。
音声を解析するには、AIが学習するための膨大なデータが必要であり、そのデータ同士に関連性が高いほど、学習効果が高まり、精度が向上します。これにより、より現場で役立つ、効果の高いサービスを提供できるのです。
現在、MiiTelの音声データは1億3000万件以上。これまで音声解析の学術研究の場では、教師データ(機械学習に利用するデータ)の収集が困難だったといいます。そんな中で、実際にビジネス最前線で話されたデータを大量に持っていることは大きな強みであり、これからさらに精度が高まっていく原動力となるでしょう。
「人が人を想う社会」の実現を目指して
当社は事業の軸を企業の生産性向上に置いており、ビジネスにおける不透明さやあいまいさを排除し、意思決定や実行のスピードアップを図っています。
このような活動によってビジネスの世界で「人が人を想う」行動が生まれ、ビジネスパーソンのコミュニケーションがよりよいものになれば、ビジネス以外のプライベートのコミュニケーションにおいても、相手のことをこれまで以上に思いやれるのではないでしょうか。
我々が手掛ける音声解析AIで扱っていくのはビジネスのコミュニケーションですが、「巡り巡って、家族や友人との心地よいコミュニケーションにも貢献できればいいな」と考えながら、日々プロダクトを開発しています。
今後、当社はこれまで紹介してきた「人が人を想う社会」を実現するために、“人の行動変容を促すことができるAI”の開発をさらに進めていく方針です。
<著者プロフィール>
橋本泰一
株式会社RevComm
執行役員 Research Director
2002年 東京工業大学 大学院情報理工学研究科 計算工学専攻 博士課程修了。博士(工学)。東京工業大学 助手および特任助教授(特任准教授)として約9年間教員として自然言語処理の研究に従事。2012年よりグリー株式会社、2014年よりLINE株式会社に在籍。ビッグデータ分析プラットフォームの開発、スマートスピーカーをはじめとするAI技術を使った製品の開発を統括。情報処理学会、人工知能学会、言語処理学会、各会員。2021年4月RevCommに参画。