スマホで読める実験医学
550円

大規模言語モデルの基礎

Foundations of large language models
10.18958/7915-00001-0006264-00
鈴木 潤
Jun Suzuki:東北大学言語AI研究センター

本稿では文章生成AIにおいて中心的な役割を担っている大規模言語モデルの基本的な動作原理,および,ユーザーからの多様な質問や要求に的確に回答できる理由の根源について概説する.付随して,昨今の大規模言語モデルを構成するトランスフォーマー(Transformer)とよばれる深層ニューラルネットワークについてもその計算の本質に触れ,生命科学分野における活用の基盤となる考え方を紹介する.数式や理論に深入りしすぎず,研究者が直感的に理解しやすい視点からその特徴と本質を整理する.

生成AI,大規模言語モデル,次単語予測,トランスフォーマー,スケール則

この記事は有料記事です

(残り約8,200文字)

  • 【スマホで読める実験医学】大規模言語モデルの基礎
    550円