誰も教えてくれなかった 医療統計の使い分け〜迷いやすい解析手法の選び方が,Rで実感しながらわかる!

誰も教えてくれなかった 医療統計の使い分け

迷いやすい解析手法の選び方が,Rで実感しながらわかる!

  • 吉田寛輝/著,山本紘司/監
  • 2025年07月29日発行
  • B5判
  • 280ページ
  • ISBN 978-4-7581-2440-9
  • 4,180(本体3,800円+税)
  • 在庫:あり
本書を一部お読みいただけます

第1章 統計基礎

4 検定と推定の違いは?

Answer
検定も推定も,得られている標本データから母集団を推測する方法です.検定は帰無仮説を棄却して対立仮説を採択するのか,それとも帰無仮説を棄却しないのか,という二者択一の結論を導きます.推定は母集団の特性を数値や区間で推測する方法です.

医療統計の1つの目的として「得られている標本から母集団を推測する」というのがあります.目の前にあるデータはあくまで標本です.標本データの特徴を知ることも重要ですが,標本データから,まだみぬデータである母集団を推測することも重要です(図1).このとき,母集団を推測する方法として「検定」と「推定」があるのです.

例えば,独立した2群間の平均値を調べたい場合を考えてみます.検定は「2群間の平均値が異なるか?」という問いに答えを出す手法で,検定を用いた結果は「差がある」か「差があるとはいえない」のどちらかです.つまり,二者択一の答えを導くための解析手法です.一方の推定は「2群間の平均値にはどれぐらい違いがあるのか?」という問いに答えを出す手法です.つまり,母集団の特性を数値や区間で推測します.そのため,推定を用いた結果は具体的な数値(例えば,2群間の平均値の差は10である)となります.

イメージとしては,英語でいえば検定は「Are there any differences between 2 groups?」という質問となり,その回答はYes/Noで答えることになります.推定だと「How much are there any differences between 2 groups?」と質問をされているイメージで,その回答は「このぐらい違いがあるよ」と答えることになります.

 検定と推定はどっちもやる

検定と推定は,どちらか一方さえ実施すればよい,というものではありません.検定を用いる場合には,帰無仮説(H0)と対立仮説(H1)が明確に設定されているのか否か,ということが重要です[7.帰無仮説と対立仮説(▶︎p.60参照)].検定を実施すると結果としてP値が算出され,P値が事前に設定されている有意水準(通常は両側0.05)を下回るか否かで,帰無仮説を棄却して対立仮説を採択するのか,それとも帰無仮説を棄却しないのか,という二者択一の結論を導きます.むやみやたらに検定を実施して,研究者にとって都合のよい結果のみを報告することは研究不正の1つとなるため,検定を実施する際には統計専門家にアドバイスを求めることが重要です.

そして,検定を実施した場合には,推定値もセットで報告することが望ましいです.推定にも「点推定*1と「区間推定(いわゆる信頼区間)*1の2種類があり,推定の際には点推定値と信頼区間の両方を報告します.そのため,検定をする場合には「点推定値」「信頼区間」「P値」の3点セットを常に報告することが重要です.決してP値のみを報告しないようにしましょう.

解説
点推定,区間推定,信頼区間*1
点推定とは,母集団の平均や割合などの真値を,手元にある標本データから 1 つの数値で推定することです.平均の差,リスク差,リスク比,オッズ比,ハザード比なども点推定値となります.
真値は点で存在するため,点推定値が真値と一致することはほとんどありません.そのため,点ではなく,ある一定の区間で真値の推定をする区間推定が重要になります.
区間推定のメリットは,点ではなく区間にすることで,区間が真値をカバーする成功確率(信頼性)を一定程度保証することが可能な点にあります1).信頼性が95%となるような区間推定を95%信頼区間と呼び,一般的に採用されています.

たまにレビュアーコメントとして,検定結果に対して「効果量を示すこと」という指示がある場合があります.「効果量を示すこと」の本質は,「P値だけではなく,どれぐらいの値(差や比)に対して有意か否かを確認するための数値を示してほしい」ということです.そのため,本質的には「点推定値」と「信頼区間」が記載されていれば,効果量が記載されていることになります.

一方の推定は,検定を用いない場合であっても母集団を推測する重要な手段です.つまり,臨床研究を実施した場合,ほとんどの状況において報告すべきなのが「点推定値」と「信頼区間」です.その研究の目的に答えを与えるような主要な結果には,必ず「点推定値」と「信頼区間」を記載しておきましょう.

 Rで比較してみよう

では実際に,Rのサンプルデータを用いて,検定と推定の両方を実施していきます.【動画⑥】

 検定:対応のないt検定

ここでは,解析結果を整理されたデータ(tidy data)として表示し,結果をみやすくできるbroomパッケージと,「2. 対応のあるデータと対応のないデータ(▶︎p.32参照)」のt検定でも用いたirisのデータを使います.ここでも2群比較を行うため,irisに含まれている3種類のアヤメのデータのうち,setosaとversicolorの2種類のデータを抽出し,がく片の長さの平均値の差の検定を行います.

■データの用意

上記のプログラムを実施すると,次のようなデータが出力されます.

次に,2群比較を実施するため,setosaとversicolorのデータを抽出する指示を入力します.

■対応のないt検定の実施

このプログラムを実施すると,次のような結果が出力されます(必要な部分のみ抜き出しています).tidy()関数を使用しない場合の結果の出力に興味がある方は,動画の解説をご参照ください.

解説でもお伝えした通り,検定をする場合には「点推定値」「信頼区間」「P値」の3点セットを常に報告することが重要であるため,今回は次のような結果の報告をすることになります.

グループ1(setosa)とグループ2(versicolor)のがく片の長さの平均値の差は,-0.93(95%信頼区間:-1.11~-0.754,P<0.001)であった.

仮に,事前に両側有意水準を0.05と設定していた場合,帰無仮説を棄却して対立仮説を採択します.

 推定:回帰分析

回帰分析でも同様に,「点推定値」「信頼区間」「P値」の3点セットが算出されます.[2.対応のあるデータと対応のないデータ(▶︎p.32参照)]で使用したdatariumパッケージと,[1.量的データと質的データ(▶︎p.26参照)]で使用したdplyrパッケージを使用しながら,datariumに含まれるmarketingというサンプルデータ[10.説明変数と目的変数(▶︎p.74参照)]を用いて,sales(売り上げ)を目的変数,YouTube(YouTubeの広告費)を説明変数とした回帰分析を行います.

■データの用意

このプログラムを実施すると,次のようなデータが出力されます.

■回帰分析の実施

上記のプログラムを実施すると,次のような結果が算出されます(必要な部分のみ抜き出しています).

上記のプログラムでは95%信頼区間が出力されていないため,confintを () 関数を用いて95%信頼区間を算出します.

上記のプログラムを実施すると,次のようなデータが出力されます.

推定の場合には「点推定値」と「信頼区間」をセットで報告することが重要であるため,今回は次のような結果の報告をすることになります.

YouTubeの回帰係数は0.0475(95%信頼区間:0.0422~0.0528,P<0.001)であった.

Point
  • 検定も推定も,得られている標本データから母集団を推測する方法である.
  • 検定は帰無仮説を棄却して対立仮説を採択するのか,それとも帰無仮説を棄却しないのか,という二者択一の結論を導く.
  • 推定は母集団の特性を,数値や区間で推測する方法である.
  • 検定をする場合には「点推定値」「信頼区間」「P値」の3点セットを常に報告することが重要である.
  • 推定は,検定を用いない場合であっても母集団を推測する重要な手段であるため,臨床研究を実施した場合,ほとんどの状況において「点推定値」と「信頼区間」は報告すべきである.

文献

  • 「生物統計学の道標」(坂巻顕太郎,他/監,著,上村鋼平,他/著),厚生労働統計協会,2023
書籍概略はこちら
誰も教えてくれなかった 医療統計の使い分け〜迷いやすい解析手法の選び方が,Rで実感しながらわかる!

誰も教えてくれなかった 医療統計の使い分け

迷いやすい解析手法の選び方が,Rで実感しながらわかる!

  • 吉田寛輝/著,山本紘司/監
  • 4,180(本体3,800円+税)
  • 在庫:あり