機械学習を用いて多彩なスタイルの要約を可能に
朝日新聞社のメディアラボは、新規事業の開発や先端メディア技術の実用化を目指す研究開発機関だ。新聞社ならではの豊富なテキスト資源を活用し、自然言語処理をはじめとした先端技術の研究開発を行っている。そのメディアラボが開発した「TSUNA」のネーミングは、「Text SUmmarizatioN Application」に由来。入力された記事本文を機械学習によって要約し、見出しや要約文を生成する。
現在は6種類の要約スタイルを用意しており、たとえば「速報テロップ向け短文スタイル」を指定した場合、「だ・である調」でニュースの要点をまとめた約50文字の短文を生成。また、「モバイルニュースアプリ向け見出しスタイル」は、体言止めを用いた約13文字の見出しを生成するという。
また、「TSUNA」では1回の要約ごとに複数の要約案を生成するため、利用者は目的に適したものを選べる。利用料金などの詳細はWebサイトにてチェック可能。
具体的な活用事例は?
朝日新聞社では「TSUNA」を活用し、新幹線車内の電光掲示板に表示されるニュース速報テロップを生成。この業務にはこれまで約90分を要していたが、「TSUNA」の技術によって所要時間が1分以内へと短縮され、業務の効率化が実現した。朝日新聞社における「TSUNA」の活用事例としては、注目記事のツイートを自動生成するSlackアプリ「Twico」も挙げられる。同アプリでは、記事の内容を要約した140文字以下のツイート文を自動生成し、Slackへ投稿。編集者はその内容を確認した上で、Slack上からツイートを行える。
「Twico」の導入前に比べてツイートの投稿数が3割ほど増え、朝日新聞社のニュースサイト「朝日新聞デジタル」への流入増加に寄与しているとのことだ。
PR TIMES
(文・早川あさひ)