ゲノム言語モデルにおける多段階推論

Multi-step reasoning in genomic language models

10.18958/7915-00001-0006266-00

中根孝文

Takafumi Nakane：株式会社DNAチップ研究所

深層学習の進展はこれまでゲノミクスにも高精度な予測をもたらしたが，多くは大量のラベル付き実験データを必要とするものであった．近年登場した大規模言語モデル（LLM）の枠組みの1つであるゲノム言語モデル（gLM）は，ラベルなしのゲノムDNA配列情報だけで事前学習することでこのハードルを下げ，例えば30億塩基対にも及ぶヒトゲノム中に存在する既知のゲノム文法の特徴を的確に捉えていることを示し，未知の文法も学習している可能性を示唆している．しかし，「どのような根拠でその答えに至ったか」を読み解くことは難しい．そこで本稿では，既存ツールを用いて段階的に推論の根拠を得るアプローチの説明から出発し，BioReasonなどgLMとLLMの統合によって「検証可能な仮説」へ至る道筋を概観する．

ゲノム言語モデル，多段階推論，BioReason，推論の説明，検証可能な仮説

この記事は有料記事です

（残り約9,400文字）

【スマホで読める実験医学】ゲノム言語モデルにおける多段階推論
550円

ゲノム言語モデルにおける多段階推論

関連書籍

特集1：疾患・生命の暗号を解き明かし、生成する　ゲノム言語モデルを使う！／特集2：イノベーションを育む研究エコシステム

ゲノム言語モデルにおける多段階推論

羊土社会員にログイン ご購読の際には羊土社会員にログインしていただく必要がございます

関連コンテンツ

特集1

関連書籍

特集1：疾患・生命の暗号を解き明かし、生成する ゲノム言語モデルを使う！／特集2：イノベーションを育む研究エコシステム

羊土社会員にログイン
ご購読の際には羊土社会員に
ログインしていただく必要がございます

特集1：疾患・生命の暗号を解き明かし、生成する　ゲノム言語モデルを使う！／特集2：イノベーションを育む研究エコシステム