スマホで読める実験医学
550円

ゲノム言語モデルによる疾患関連遺伝子探索

Prediction the effects of genome-wide variants using genomic language models
10.18958/7915-00001-0006267-00
小針靖子,高山 順
Yasuko Kobari1)/ Jun Takayama2)3):群馬大学医学部附属病院小児科1)/東北大学大学院医学系研究科2)/理化学研究所革新知能統合研究センター3)

従来のTransformerアーキテクチャの課題を克服するため,HyenaDNAやEvo2(StripedHyena2)といった新たなゲノム言語モデルが登場し,最大100万トークンの超長コンテキストでゲノムワイドな疾患DNA配列バリアント効果予測が可能となった.Evo2では参照配列のみの学習で出力される配列尤度(likelihood)が,適応度(fitness)として代用され,事前学習がなくともDNA配列バリアントの有害性予測において高い精度を発揮した.さらに,埋め込みベクトル(embedding)を用いた分類器への接続により,予測精度を向上させる方法も提案されている.なかでもノンコーディングバリアントの有害性予測について非常に高い機能予測精度を示したことからも,今後ゲノム解析の解決率の向上に寄与することが期待される.しかしながら,広範なタスクで有望であるものの,特定のバリアントについては予測精度に課題が残されており,タスク特異的なモデルの開発が求められている.

ゲノム言語モデル,Variant effect prediction,ノンコーディングバリアント

この記事は有料記事です

(残り約9,300文字)

  • 【スマホで読める実験医学】ゲノム言語モデルによる疾患関連遺伝子探索
    550円