こうしたことから、医薬品の開発スピードを上げ労力を削減を果たすべく、AIの活用が期待されているのだ。
このほど、デューク大学の研究者に協力を求められたGoogleの研究チームは、タンパク質結晶を見つけ出す機械学習アルゴリズムを開発した。
タンパク質の構造解明を容易にすることによって、創薬を加速する可能性がある。
・タンパク質結晶化の識別をAIに
タンパク質の構造は、塩や砂糖のような単純な分子と違って複雑かつ多様。なかには数万個の原子を含んだ大きな分子などもある。そんなタンパク質の構造を知ることは、人体でどんな働きをするのかを理解し、標的とする新薬を開発するための鍵となる。
タンパク質の構造を検出する際にはまず、タンパク質を結晶化する必要があり、これが大変困難な作業。
従来、溶液のなかで成長する混合物を見ながら、結晶化しているかどうかを識別する作業は人間がおこなっていた。
しかし、結晶化は非常にまれで、見つけるのは難しい。このため、研究者が見落としてしまい、貴重な生物学的発見の機会を逃してしまうリスクがある。
研究者による識別作業をAIにやってもらおうというのが、今回の試みだ。
・タンパク質結晶の画像50万枚を活用
GoogleのBrainチームは、タンパク質結晶化を識別するためのアルゴリズムを作成すべく、50万枚のタグ付けされた画像と研究者による識別結果のデータセットを活用。これは、産学連携プロジェクト「MARCOイニシアチブ」のタンパク質結晶に関するデータの共有ライブラリーからのものだ。
トレーニング後の検証では、約95%でタンパク質結晶を同定できた。ちなみに人間の専門家による識別率は85%とのこと。
研究チームは、創薬の加速のために、モデルをオープンソース化して研究者が利用できるようにしている。識別モデルが確立された次の段階として、タンパク質結晶化のメカニズム解明が期待される。
参照元:Automating Drug Discoveries Using Computer Vision/Google AI Blog
Teaching a Machine to Spot a Crystal/Duke Research Blog