統計の落とし穴と蜘蛛の糸
  • [SHARE]
  • Send to Facebook
  • このエントリーをはてなブックマークに追加

第1回
データ解析の第一歩は計算ではない

質問コーナー

本連載第1回2014年2月号掲載)の内容に関連して,以下の質問をいただきました.

質問

散布図の幹葉表示の作成方法が一部分理解できません。具体的には葉の「7」「45」「223」「01」「8」「3」の分割の規則はどのようになっているのでしょうか。

回答

テューキーの「幹葉表示」は,広く用いられているヒストグラムから箱ひげ図への橋渡しとみなされるデータ可視化の方法です.その手順について以下に補足説明します.第1回図2の「累積番号」は最大値および最小値からメディアンに向かって累積されていく番号です.この数値例ではデータの最小値と最大値がそれぞれ3と17ですので,幅2(任意の幅)の区間で全範囲を分割することにします.このとき,最小値3を上端に,最大値17を下端に置いて,幅2の区間を順に積み重ねることで幹葉表示が描かれます.上端の区間[2,3]に入るデータは3だけです.3は一桁の数ですから十の位は「0」で一の位は「3」となります.この「0」が“幹”となり,「3」が “葉” になります.続く2つの区間[4, 5]と[6, 7]に入るデータはありませんので空白にしておきます.その次の区間[8, 9]にはデータ8が入るので,その幹と葉はそれぞれ「0」と「8」となります.その下の区間[10, 11]には2つのデータ10と11が属しますから,共通の幹「1」に対して2つの葉「0」と「1」を並列表示します.同様にメディアンが属する区間[12, 13]の3つのデータ12, 12, 13についても,共通の幹「1」の横に3つの葉「2」「2」「3」を並列します.このように最下段の区間[16, 17]にいたるまで続ければすべての幹葉表示が完成します.

補足説明
実験医学最新号

実験医学 2014年2月号 Vol.32 No.3
生活習慣か,遺伝か,腸内細菌か? 肥満克服のサイエンス
代謝の変容と脂肪細胞の制御から,最新治療まで

梶村真吾/企画