いくつかのキーワードを入力して検索するのでは、なかなか目当ての研究結果にたどり着かないことも多い。
また、質問の意味を理解してWebページの中から答えを提示するのが得意なGoogleだが、アカデミックなものに対象が絞られると勝手が違ってくるようだ。こうしたことから、Googleは、新型コロナに関する論文検索ツール「COVID-19 Research Explorer」をリリースしている。
検索結果に表示の論文に追加で質問できる
COVID-19 Research Explorerを利用すると、5万以上の論文からなる「COVID-19 Open Research Dataset」内を、質問形式で検索できる。質問に対して、まず回答を含む可能性のある論文タイトルと、その該当部分の抜粋を表示。さらに、リスト化された論文内を追加の質問で検索可能だ。
Googleによる解説記事によれば、「What regulates ACE2 expression?(ACE2発現を調節する物質はなに?)」との質問には、生物学で複数の意味を持つ「regulates」という単語が含まれ、適切な検索結果の提示には文脈の理解が必須だという。
自然言語処理モデル「BERT」を用いてトレーニングデータを生成
Googleは自然言語処理モデル「BERT」を用いて、セマンティック検索を強化している。検索モデルのトレーニングでは、人間によりキュレートされた生物医学のデータセット「BioASQ」を用いた。ただ、同データセットはサイズが小さいため、文章生成の要領で、生物医学に関するドキュメント内の回答から、質問や検索キーワードを生成。大規模トレーニングデータを作成して利用したとのこと。
こうしてリリースされたCOVID-19 Research Explorerは無料で利用でき、新型コロナに関する調べものを効率化してくれそうだ。
参照元:An NLU-Powered Tool to Explore COVID-19 Scientific Literature/ Google AI Blog