スマホで読める実験医学
550円

ゲノム言語モデルにおける多段階推論

Multi-step reasoning in genomic language models
10.18958/7915-00001-0006266-00
中根孝文
Takafumi Nakane:株式会社DNAチップ研究所

深層学習の進展はこれまでゲノミクスにも高精度な予測をもたらしたが,多くは大量のラベル付き実験データを必要とするものであった.近年登場した大規模言語モデル(LLM)の枠組みの1つであるゲノム言語モデル(gLM)は,ラベルなしのゲノムDNA配列情報だけで事前学習することでこのハードルを下げ,例えば30億塩基対にも及ぶヒトゲノム中に存在する既知のゲノム文法の特徴を的確に捉えていることを示し,未知の文法も学習している可能性を示唆している.しかし,「どのような根拠でその答えに至ったか」を読み解くことは難しい.そこで本稿では,既存ツールを用いて段階的に推論の根拠を得るアプローチの説明から出発し,BioReasonなどgLMとLLMの統合によって「検証可能な仮説」へ至る道筋を概観する.

ゲノム言語モデル,多段階推論,BioReason,推論の説明,検証可能な仮説

この記事は有料記事です

(残り約9,400文字)

  • 【スマホで読める実験医学】ゲノム言語モデルにおける多段階推論
    550円