実験医学別冊 最強のステップUPシリーズ:エピゲノムをもっと見るための クロマチン解析実践プロトコール〜ChIP-seq、ATAC-seq、Hi-C、smFISH、空間オミクス…クロマチンの修飾から構造まで、絶対使える18選!
実験医学別冊 最強のステップUPシリーズ

エピゲノムをもっと見るための

クロマチン解析実践プロトコール

ChIP-seq、ATAC-seq、Hi-C、smFISH、空間オミクス…クロマチンの修飾から構造まで、絶対使える18選!

  • 大川恭行,宮成悠介/編
  • 2020年12月18日発行
  • B5判
  • 270ページ
  • ISBN 978-4-7581-2248-1
  • 定価:7,590円(本体6,900円+税)
  • 在庫:あり
書籍を購入する
本書を一部お読みいただけます

第1章 NGSによるクロマチン解析

9 探索型解析によるクロマチンNGSデータ分析のコツ〔レビュー〕

column

NGSライブラリー調製までできた.さて,この後どうする?
〜NGSのコスト(費用と労力)とデータ解析の話

対談:大川恭行1)×宮成悠介2)
(九州大学生体防御医学研究所トランスクリプトミクス分野1),金沢大学ナノ生命科学研究所がん進展制御研究所2)

研究上の新たな発見の多くは,新しい解析法をとり入れることによってもたらされることが多い.しかし,新技術の導入は時間・コスト・失敗のリスクを考えると,そう簡単にチャレンジすることはできないだろう.特に次世代シークエンサー(NGS)の活用は,シークエンサー本体を使う工程やその後のデータ解析など,どのようにすすめるべきかイメージができず挑戦を躊躇している読者も多いのではないかと想像する.そこで本稿では,本書の編者でもあるNGS活用歴10年以上の大川恭行と,数年前にNGS解析をはじめた宮成悠介により,NGSを用いた解析の悩ましいポイントについて対談形式で議論する.NGSを利用したいが,実際どうしたらよいのかわからないと悩める読者の助けになれば幸いである.

自己紹介

大川恭行専門はクロマチン研究.NGSはエピゲノム解析を主として国内ではいちはやくとり入れた(2008年頃).最近は各種オミクスの新しい解析法の開発にも手を付けてしまい,技術開発が研究のメインテーマとなりつつある.

宮成悠介専門はエピゲノム研究.数年前にNGS解析をスタートした新規参入者.もともとインフォマティック解析が苦手だったが,少しずつ勉強して,今ではNGS中心の論文を書けるようになった.

シークエンスは外注or自分でする?

大川まずはシークエンサー本体を実際に動かす工程についてお話しましょう.私は自分でシークエンサーを動かしてデータを生成してきましたが,宮成さんは,ファシリティ(大学や研究所内の研究支援部門)や外注サービスを駆使して成果を出されていますね.スタイルは異なりますね.

宮成私たちは,自分たちでNGSライブラリーを調製しているので,ライブラリーを送るとシークエンスの生データが返ってくるサービスがあれば十分だと思っています.つまり,手元にシークエンサー本体はいらない.データ解析は自分たちでやっています.

大川海外ではそれが当たり前になっていると思います.十分な経験値をもとにした技術的なフィードバックを行える海外研究拠点のファシリティと,仕様書にもとづいて型通りの外注サービスを多く行っている国内のファシリティに大きい違いが出ています.個人的には日本の研究者にもっとシークエンサーを触ってほしいという想いはあります.

宮成外注といってもシークエンスだけでなくライブラリーの作製まで行ってくれるサービスもありますが,このサービスはどうでしょう.本書で紹介しているようなクロマチン解析をやってみたいと思っている研究者はたくさんいると思いますが,経験がない研究者にとってはライブラリーをつくるのに尻込みすると思います.

大川そうですね,ハードルは高いと思います.

宮成例えば,バイオアナライザーやqPCRによるライブラリー定量にもちょっとしたノウハウがありますよね.経験もないし失敗したくないから,丸投げして外注したいという気持ちは十二分にわかりますね.

大川私も同感です.ただ,外注サービスは今のところRNA-seqやATAC-seqなど,限られたアプリケーションに限定されています.また,すべてを丸投げにするとサンプル調製で不測の事態が起こってもユーザーは気づくことは難しいですよね.

宮成不測の事態って,例えば何ですか?

大川例えば,サンプル間のコンタミです.最近はNovaSeq(イルミナ社)などを利用した大規模解析がよく行われるようになり,1回の解析でのリード数が増えています.仮に0.01%別のサンプルのDNAが混入し,そのリードが特定の配列に偏っていた場合,データへの影響は無視できないと思います.かなり慎重になるべきでしょう.

宮成サービスとしての要件は満たしているが,それがこちらの解析の目的レベルを満たすかどうかは別問題ですね.

大川だからこそ,ライブラリーの作成にかかわって欲しいと思っています.それが今回のプロトコール書の企画を受ける動機でもあります.本書をきっかけにライブラリーを自分でつくってみようと思ってもらえればいいですね.

NGSのランコストを下げるには?

大川単純に次世代シークエンサーを走らせるランの部分のコスト(費用)を削減する選択としては国内企業,後は海外企業や海外大学のファシリティを利用するという手がありますね.

宮成何より本書でも紹介している先進ゲノム支援(第1章-9 column参照)は心強い味方ですね.研究の相談から,シークエンス,データ解析まで幅広いサポートを受けることができます.

大川一方で解析にかかる時間は気をつけたほうがいいですね.サービスを利用してその辺はどうでしたか?

宮成私は企業への外注だとマクロジェン社しか使ったことなくて,そのときはサンプル(ライブラリー)の発送から生データの納品まで最短で4週間くらいでした.

大川それ,外注サービスとしてはかなり早いほうだと思います.

宮成そうなのですか.でも,論文のリバイスのときはもっと早くデータが帰ってきてほしいですね.UCB(University of California, Berkeley)やNYU(New York University)などの海外ファシリティの場合はサンプルを送って5日後くらいでデータ帰ってきたりします.

大川そうですね.ファシリティは総じてランのレスポンスはいいので,リバイスにはいいかもしれません.

宮成でも,海外ファシリティのサポートはあまりよくないですね.商業目的ではなく,ほぼボランティアとして仕事を引き受けているのでしかたないですけど.シークエンサーの特性やサンプル調製のイロハを知ったうえでオーダーすることになるので,はじめてシークエンスにトライする方には簡単ではないと思います.

大川同感です.外部から受託解析にはサポートはほぼないですね.あえてここでアピールさせてもらいますけど,私の所属する九州大学生体防御医学研究所の共同利用を活用してもらえれば,ランだけですがかなり早く回せると思います.

宮成大川さんの仕事が増えますけど(笑)

大川ランだけなら大丈夫です.実験デザインや解析まで含めると難しいです(笑)

1回のランコストを気にするより研究全体のコストを気にすべし

大川コストを下げたいのであれば1回のランコストを気にするよりも,ランの回数や必要に応じて安価なプロトコールを選択するなどの手段が有効だと思います.そのためには,やはり研究計画が重要でしょう.例えば海外の研究者の研究費申請書を査読したことがあります.海外の研究では精密な試算が義務付けられていて,「どれくらいの検体数があると統計的に優位な差が出る可能性があるから,これくらいのスケール(検体数)の解析をしなくてはいけない.だから,これだけのライブラリーの調製が必要で,1ライブラリーあたりこれくらいのリード数が必要である」というふうに丁寧に書いてあるんです.つまり最初の段階で最終段階の統計解析が見積もれているので,バイオインフォマティクスによるデータ処理や細胞培養や動物個体数まで見積もれています.ここまで考えられていると,例え一部で外注を利用しても,費用や労力の削減が可能だと思います.まずは実験計画を詳細に書いてゴールを設定するところからはじめてみるのはどうでしょうか? NGSデータをとってから考えるでは,論文までプロジェクトを仕上げるにはあまりにもあやふやな計画になってしまいます.

宮成そうですね.レプリケートをいくつ用意するかも大事ですよね.

大川そうです.例えば,リンパ球と線維芽細胞のように全く発現プロファイルが異なる細胞を比べるようなRNA-seqの場合は,条件あたり3検体も解析すれば有意差のある遺伝子は山ほど検出できます.ところが,細胞の分化過程を比較ときには十分な検体数(通常は5〜6以上)測ったほうがきれいな結果がでます.いわゆる検定力の話になります.じつはこれ,乗数的になっていきますから金銭的コストに直結しますよね.

それから,プロトコールの選択も重要です.例えば定量データをとるだけであれば完全長RNA-seqを行う必要はありません.BRB-seqのような3′UTR-seqをおすすめします.これだけで必要なリード数は1/20以下になり一気に安くなります.検出遺伝子数を増やして特異的遺伝子を同定したい場合は理化学研究所の二階堂さんが開発したRamDA-seqもスマートな選択ですね.クロマチン解析も同じです.ChIP-seqで行うか,ChIL-seqやCut&Tagのような方法をとり入れることで実験のスケールは大きく変わります.その解析法の選択にも本書をお役立ていただきたいですね.

宮成最終的には,どのシークエンスのプラットフォームで,どれくらいのリード数を取得するのか,まで考慮すべきですね.

大川そうですね.まとめると,まずは研究計画で最終的にどのようなクエスチョンに答えたいのかを明確にする.そして,その解析をするために必要な検体数の適切な見積もり,必要な情報を取得するための適切なプロトコールの選択する.この3つをあらかじめ考えることで,NGSの1ランのコストをそこまで気にすることなく研究全体のコストを削減できる思います.

データ解析をどう進めるか?

宮成データ解析までを含める外注サービスは,型通りの解析データを出してもらえるところまでは便利でいいのですが,さらに一歩二歩と踏み込んだ解析をやろうとすると簡単ではないように思います.データの抽出はもちろんのこと,統計処理や結果の解釈など,論文に仕上げるまでのプロセスで,外注したユーザーは相当苦労するのではないでしょうか.私はそこが一番気になります.

大川出ましたね.核心の話が.

宮成私のはじめてのNGSプロジェクト(ChIP-seq)は大川さんとの共同研究でした.そのときは,苦戦しながらもライブラリー作製は自分でやったのですが,シークエンス以降の解析は大川さんたちに丸投げしました.大川さんのチームがマッピングまでやってくれたので,そのデータをもとに大川さんたちと研究の相談をしたんですけど,まともなディスカッションにならなかったのを今でも覚えています.要は,私たちのデータ解析周辺の知識がなさすぎで,大川さんが何のことを言っているのかが,全く理解できなかったんです.ChIP-seqのピークが見えたからって,素人にはそのデータをどう活用すればいいかがわからない.そのことがきっかけで,自分でデータ解析するしかないと決断しました.

大川私のフォロー不足で谷底へ突き落してしまいました.多くのプロジェクトで声をかけていただくのは研究者冥利に尽きます.一方で,うちの研究室のメンバーも独自のプロジェクトを進めているなかで共同研究に取り組みます.一時期,70件以上の共同研究が平行して走ったこともあり,全員,文字通り不眠不休の日々が続いていました.その結果,一部の方には望むようなデータ解析まで至らなかったことは確かにあると思います.PIとして責任を痛感しますね.

宮成NGSのデータ解析ができる研究チームでは,同じような問題が頻繁に起こっているような気がします.共同研究としてデータ解析をお願いしても,引き受けた側からすると自分のプロジェクトではないので,どうしても後回しにしてしまうのはしかたのないことだと思います.

また,支援にも限りがあります.外注サービスでデータ解析してもらうにしても,やっぱり丸投げだと,解析のクオリティがぐんと下がると思います.例えば,特注の誕生日ケーキを愛する娘に準備したいとき,自分ではケーキをつくれないので「こういうのをつくって欲しい」と,自分のイメージをケーキ屋さんに伝えますよね.でも,でき上がったのは何の変哲もない普通のケーキ.本当はもっと素晴らしいケーキができるはずなのに,こちらにはケーキづくりに関する技術もなければ知識もない.お店が提供する誕生日ケーキをそれ以上どうすることもできず,受けとるしかないんです.

大川そうですね.依頼する側がしっかりと把握していないと,共同研究先あるいは外注先の用意した型通りの解析を黙って受けとることしかできなくなりますね.

宮成私の経験から言うと,やはりデータ解析は,依頼者側が覚悟を決めて勉強しないといけないっていうのが,シークエンスに必ず付随してくる問題かなと思うんです.

大川私と宮成さんが共通しているのは,全体像を理解しないとNGS解析を論文にするのは難しいから,ちゃんと自分で考えましょうというところですよね.実際,国内外の次世代シークエンサーを使っておもしろい発見をしている方々は,自分たちの研究室のなかでライブラリー作成とデータ解析を行っていることが圧倒的に多いです.やっぱり一貫してすべてのプロセスを把握することが,論文にするときには必要だと思います.

宮成そうですね.最近は,NGS解析のプログラムが豊富にありますし,私のように新規に参入する場合の敷居はすごく低くなってきていると思います.一方で,解析アルゴリズムの違いによって結果が大きく変わりうるので,注意しないといけないですね.NGSでのクロマチン解析は覚えることも多くてたいへんですけど,それ以上に得るものは大きいですので,皆さんにもぜひトライしてもらいたいですね.

書籍概略はこちら
実験医学別冊 最強のステップUPシリーズ:エピゲノムをもっと見るための クロマチン解析実践プロトコール〜ChIP-seq、ATAC-seq、Hi-C、smFISH、空間オミクス…クロマチンの修飾から構造まで、絶対使える18選!
実験医学別冊 最強のステップUPシリーズ

エピゲノムをもっと見るための

クロマチン解析実践プロトコール

ChIP-seq、ATAC-seq、Hi-C、smFISH、空間オミクス…クロマチンの修飾から構造まで、絶対使える18選!

  • 大川恭行,宮成悠介/編
  • 定価:7,590円(本体6,900円+税)
  • 在庫:あり
書籍を購入する