香港中文大学(CUHK)の研究チームは、ガンの誘発にも深く関わるこの遺伝子発現のメカニズムを、機械学習と自然言語処理で解明しようとの意向だ。
チームが開発したフレームワーク「Gene Expression Embedding frameworK(GEEK)」は、遺伝子発現に関わる複数のメカニズムを同時に研究できて、複雑な相互作用の解明に期待できる。
関連するメカニズムを同時に研究
チームの研究者は、2017年に「エンハンサー」と呼ばれる遺伝子の発現調節にとって重要な役割を担う領域を研究した。エンハンサーによる遺伝子発現への影響を調べる過程で、肝臓ガンに関連している可能性のある3つの遺伝子を発見したという。ただし、この研究では、ほかの遺伝子発現に関する研究と同様、個別のメカニズムのみに焦点を当てたため、メカニズム間の複雑な相互作用を完全に理解することはできなかったという。
チームの研究者によると、この複雑な相互作用の課題を単純化すると、リモコンが効かないときに、リモコン側に問題があるのかデバイス側に問題があるのか、相互通信に問題があるのか……がわからず、これらを同時に調べるツールがあれば原因の特定が簡単になるという。
遺伝子を単語として扱い自然言語処理
GEEKでは、機械学習と自然言語処理を利用しており、遺伝子を「単語」として、それらの関係性を「文章」として扱う。研究ではGEEKを使用して、ゲノムの編成状態やタンパク質の相互作用など、複数の遺伝子発現調節メカニズムを研究。これらのメカニズムが一緒にモデル化されたとき、別々に研究されたときよりも遺伝子発現をうまく説明できたという。
ガンは、異常な増殖を引き起こす突然変異した細胞に起因する。チームは、GEEKを使用して肝臓ガンのいくつかの原因究明を目指す。長期的には、ほかの種類のガンにも研究を拡大し、新しい予防法および、免疫療法をはじめとする治療法の開発に貢献したいと考えているようだ。
参照元:New AI Approach by CUHK Engineering Investigates Multiple Gene Regulatory Mechanisms Concurrently For the Advancement of Biomedical Research/ CUHK