一方で、感情や差別的発言を正確に識別するには、AIが文脈から「皮肉」を理解する必要があり、これには困難を伴っていた。このほど、MITメディアラボの研究者らは、DeepMojiと呼ばれるアルゴリズムを機械学習により訓練し、Twitter上の発言内容から高い精度で皮肉や感情を見分けることに成功した。
・身振りやイントネーションの替わりとして絵文字を
DeepMojiでは、ツイートの文脈理解を助けるために絵文字を活用している。MITメディアラボの准教授であるIyad Rahwan氏は、話し言葉と違い、身振りやイントネーションの表現が入っていないテキストにおいて、文脈を理解するのに絵文字が役立つことに着目した。
テキストの感情分析はすでに広く使用されている技術で、多くのツイートについて、絵文字などを通してラベル付けがなされている。DeepMojiの開発にあたってこれらのデータセットが活用された。
・12億個のデータセットでアルゴリズムを訓練
アルゴリズムを訓練するにあたって、550億個のつぶやきを収集し、その中から64個の人気のある絵文字の組み合わせを含む12億個を選択した。これらについてまず、テキストに含まれる「幸せ、悲しい、ユーモラス」といった特定の感情にマッチした絵文字を予測する訓練を実施。
その後、ラベル付けされた既存のデータセットを活用し、皮肉を識別する訓練を実施した。
・判別精度は人間を超える
こうして訓練されたDeepMojiは、テキストから感情を検出するベンチマークテストにおいて、既存のアルゴリズムよりもはるかに高い精度を示したとのこと。また、人間に対して実施したテストでは、Twitter上の発言内容から、皮肉や感情を正しく識別したのが平均76%だったのに対し、DeepMojiでは82%となり、人間よりも優れた結果を出している。
DeepMojiのWebサイトでは、英文テキストを入力すると適切な絵文字を自動的に追加してくれる。また、このWebサイトでは、自分の最新3つのツイートについてラベル付けすることで、DeepMojiの更なる発展に貢献することもできる(こちらは日本語も可)。
AIが文脈を深読みする能力は、今後もますます向上すると考えられ、テキストの判別のみならず、AIと人間のコミュニケーションにも役立てられると予想される。
DeepMoji