科学論文は毎日大量に発表されるため、研究者がそのすべてに目を通すことは不可能だ。しかし、MITの研究チームが開発したAIを活用すれば1~2文の要約で内容を把握できる。
同アプローチはまた、機械翻訳や音声認識など、言語処理以外のさまざまな分野でも役立つものだという。
・物理学向けプロジェクトでの発明を自然言語処理に応用
実はこの論文要約AIは、物理学における基本法則を改善するためのプロジェクトから偶然生まれたものだ。研究チームは、同プロジェクトで開発されたアプローチが、既存のニューラルネットワークシステムが備えた根本課題を解決する可能性があることに気づいた。
一般的にパターン認識などを得意とするニューラルネットワークも、論文を構成するような長いデータに関して、前後の文脈を関連させながら解釈することが苦手とされる。
こういった機能を向上させるために、RNN(Recurrent Neural Network)の一種で時系列データを扱う「LSTM(Long short-term memory)」などが用いられているが、まだまだ自然言語処理に求められる精度には程遠い。
・多次元空間の回転ベクトルを想定
研究チームは、従来のニューラルネットワークのような行列の乗算によるものでなく、多次元空間で回転するベクトルに基づく代替アプローチを考案した。「 Rotational Unit of Memory(RUM:回転記憶単位) 」と呼ばれるこのアプローチでは、文章内の各単語を多次元空間内のベクトル、つまり特定の長さと方向を持つ線で表す。
続く単語のベクトルは、それ以前の持つベクトルの向きに影響を受けて振れ、数千の次元を持つことができる理論上の空間で表される。そして、最終的なベクトルまたはベクトルのセットが一連の単語に変換される。
・従来のAIよりも読みやすい要約を生成
研究チームが、LSTMベースのシステムとRUMベースのシステムで同じ論文を要約させたところ、LSTMシステムの要約が専門用語を多く含み、冗長的な内容だったのに対し、RUMシステムではより読みやすく、余分なフレーズの反復がない要約を生成した。RUMベースのシステムはすでに拡張されているため、抄録だけでなく論文全体を読んで内容の要約を作成することができる。
同アプローチは、長期的な依存関係が重要となる自然言語処理および強化学習の分野に大きな影響を与える可能性がある。
参照元:Can science writing be automated?/MIT News