この記事は有料記事です
(残り約9,300文字)
-
【スマホで読める実験医学】ゲノム言語モデルによる疾患関連遺伝子探索
550円
従来のTransformerアーキテクチャの課題を克服するため,HyenaDNAやEvo2(StripedHyena2)といった新たなゲノム言語モデルが登場し,最大100万トークンの超長コンテキストでゲノムワイドな疾患DNA配列バリアント効果予測が可能となった.Evo2では参照配列のみの学習で出力される配列尤度(likelihood)が,適応度(fitness)として代用され,事前学習がなくともDNA配列バリアントの有害性予測において高い精度を発揮した.さらに,埋め込みベクトル(embedding)を用いた分類器への接続により,予測精度を向上させる方法も提案されている.なかでもノンコーディングバリアントの有害性予測について非常に高い機能予測精度を示したことからも,今後ゲノム解析の解決率の向上に寄与することが期待される.しかしながら,広範なタスクで有望であるものの,特定のバリアントについては予測精度に課題が残されており,タスク特異的なモデルの開発が求められている.
この記事は有料記事です
(残り約9,300文字)
【スマホで読める実験医学】ゲノム言語モデルによる疾患関連遺伝子探索
550円