書 評
21世紀の生命科学でデータ解析ができない研究者はじきにいなくなるだろう
谷内江 望
(ブリティッシュコロンビア大学Biomedical Engineering教授,大阪大学WPIヒューマン・メタバース疾患研究拠点 (PRIMe) 特任教授,東京大学先端科学技術研究センター客員教授.2009年に慶應大学において生命情報科学の分野で学位取得後,ハーバード大学とトロント大学のFrederick Roth博士の下で研究員として合成生物学の研究に従事.2014年より東京大学准教授,2020年よりブリティッシュコロンビア大学准教授,2023年より現職.)
最近流行りのあのオミクス解析をやってみたい.でも,自分の研究で具体的にどういう条件で実験を進めたら良いのか,どういうデータ解析をしたら良いのか,あるいはどういう風に解析をするのかわからないという壁に当たる方は多いと思う.これらのどれかに直面している皆さんにとって本書は現在考えられる限りでベストである.
よく,「こういうデータを取って研究したいが,どういう風にやったら良いのか分からないのでアドバイスが欲しい」と声をかけられることがあるが,そういうふわっとした質問に的確な助言は難しい.こういう時は,そもそも聞いている本人が何を具体的にしたいのか分かっていない.仮説と実験と解析がきちんと噛み合っていないと良い研究は成立しない.誰かにコンサルしてもらうにしても,アドバイスの内容を的確に掴み,「そういう事がやりたいわけじゃないからこういう方向性の解析を考えて欲しい」と返せるくらいは理解している必要がある.そして,そういうセンスを磨くためには,少しずつ時間をとって自分でも手を動かした経験を積むしかない.
本書が基本とする「ファーストアクションは決まっている」というメッセージに大きく首肯する.少し加えるなら,研究者が共通して取ることになるファーストアクションがあるのは,データが本来もつ性質がそれを規定するからである.だから,ファーストアクションを自分でやってみることでデータを知ることができ,さらに自分の研究においてどのような利用ができるか検討してみる力が付く.
本書は演習形式で構成されている.解析のためのデータが全て提供されているかオンラインで入手可能になっており,読み進めながら自分でどんどん経験を積める.全く経験がなくてもChatGPTなど生成AIにどういう意味か聞きながら進めれば,十分に未経験者でも読めるだろう.大変良く出来ており,大学のバイオインフォマティクス演習の講義を置き換えられると思う.
多様なデータ解析の例が掲載されているが,初学者は自分のやりたい解析だけつまみ食いするのではなく,全部を経験してみるのが良いと思う.基本を押さえながら多様な解析技術の広がりを知ることで,もちろん自分でできるようになったり,共通点が見つけられたり,自分の解析を工夫したり,組み合わせて新しい研究を企画したりできるようになるだろう.
プログラミング言語はその名詞のとおり,言語であり,データ解析はその言語圏の文化のようなものである.一部のプロフェッショナルのものではないし,肩肘を張るようなものでもない.人工知能が台頭するなか,生命科学でもデータ解析にセンスがなく,AIと競おうともせず,誰かに頼ろうとする研究者はそのスピードに追いつけなくなってしまうだろう.反対に,データをAIなどを駆使して操る研究者の未来はますますエキサイティングである.本書は多くの研究者の道を明るく照らすだろうと確信している.
