ため息をついた後にこぼれ出るように言う「ありがとう」、ややぞんざいな具合の「ありがとう」、無機質な口調の「ありがとう」。それぞれの意味合いはまったく異なる。
そんな“声”から感情や健康状態を解析するプラットフォームを提供しているのが、マレーシアを拠点とするThe smarter solution Edgeだ。
朗読を解析し、心理状態を診断
5月15日・16日に東京ビッグサイトで開催された「SusHi Tech Tokyo 2024」のグローバルスタートアッププログラム。
世界各国のスタートアップが展示を行ったこのイベントの一角に、The smarter solution Edgeのブースがあった。多くの人が訪れていたこのブースには、大きな収音カップのついたマイクが2台、テーブルの上に並んでいる。そこに着席した人が、何やら朗読をしているではないか。
これは、あらかじめ用意された文章をそのまま読み上げているという。録音した声を「Voice For Health」というプラットフォームで解析し、気分やストレスレベルなどを検出するそうだ。
The smarter solution Edgeのブースを主宰した感情分析マスタートレーナーBrandon Chua氏に話を伺った。同氏は「人間は木の年輪のようなもの」だと語る。
木の年輪は、その木の樹齢が記録されているのみに留まらない。かんばつ、大雨、虫害などの災難をいつ乗り越えたかも確認することができる。歴史的に語り継がれている木が倒壊した際、残った幹の年輪を見て史料に書かれている自然災害が本当に発生したのかなどを調査する研究分野もある。
人間もそれと同様、さまざまな経歴を重ねている。そして、それは声に出るというのだ。
こうした声のニュアンスから「まだ癒されていない感情的な傷や未解決のトラウマを示すパターン」を特定するように設計されたのが、このVoice For Healthである。
同プラットフォームでは、AIと機械学習の力を通じて、声のデータから健康状態の早期警告サインを検出することが可能。同技術により、医療専門家が患者をより早く診断し治療できるよう支援する。
公式サイトで日本語の朗読文章も用意
Brandon氏曰く、「Voice For Healthの公式サイトで、すでにオンライン診断を受け付けています」とのことで、スマホが1台あれば診察前の記録取り、すなわち朗読音声の収録ができるという。さっそくVoice For Healthの公式サイトに訪問すると、音声収録は多言語に対応しているのが確認できた。現在は英語、簡体中国語、繁体中国語、韓国語、マレー語、インドネシア語、そして日本語がラインアップされている。
さまざまな言語の中から、日本語の「レコードする」をタップしてみると、このような文章が出てくる。
皆さんは、自分の声が自分について何を語っているか、今までに不思議に思ったことはありますか? 人間の声が感情を伝え、隠された真実を明らかにする驚くべき方法について、考えたことはありますか? 電話越しに子どもの声を聞いただけで、何かがおかしいと感じる母親のことを想像してみてください。または、エンジンの音を聞くだけで車の問題を正確に特定できるメカニックのことを考えてみてください。 私たちVoice for Healthでは、人間の声の力に魅了されています。それはこの惑星上の他の生き物と私たちを区別し、私たちの感情や健康状態に関する豊富な情報を運んでいます。
ここまではさわりの部分で、その後もVoice For Healthの信念が書かれた文章が続く。進行バーが100%になるまで読み上げれば、録音は完了だ。その後、48時間(営業日)以内にBrandon氏からWhatsAppでメッセージが届く。収録した録音を基にオンライン診療をZoomで開始する、という流れだ。
この際、注意点がいくつかある。まず、収録に使うデバイスはスマホでもPCでもいいが、極力静かな環境で行うこと。これが酷い場合は収録をやり直さなければならなくなるため、場合によっては上の写真にもあるようなしっかりしたマイクが欲しいそうだ。だからこそ、ブースにあったマイクには大きなカップがついていたという事情もある。
また、Brandon氏とのZoomでの面談は基本的に英語かマレー語、インドネシア語である(マレー語とインドネシア語は姉妹言語)。そのどちらもできない場合は、Zoomの翻訳字幕機能を用いるという。
患者のモニタリング、治療結果の測定に活用
さまざまな健康状態の早期発見、監視、治療に役立つことが期待されるThe smarter solution EdgeのAI音声解析サービスは、医療に革命を起こす可能性を秘めている。たとえば、喘息やCOPD(慢性閉塞性肺疾患)といった慢性疾患の患者を遠隔でモニタリングすることが可能に。患者の状態の変化を早期に特定し、迅速な介入と入院のリスク軽減につなげる。
また、臨床試験での新薬や治療法の有効性・安全性を監視する際にも役立つ。従来の主観的な測定よりも客観的かつ正確な測定ができる。
もちろん、音声の正確な識別のために、AIトレーニング用の大規模なデータセットが必要であること、そして患者データのプライバシーとセキュリティの確保などの課題もあるが、ヘルスケアにおけるメリットは大きいという。今後もThe smarter solution Edgeのサービスに注目していきたい。
参考・引用元:
The Smarter Solution Edge
Voice For Health
(文・澤田 真一)