ねこすたっと

ねこの気持ちと統計について悩む筆者の備忘録的ページ。

サンプルサイズ計算:2群の2値アウトカムを比較する(極端な割合) [G*Power]

自分用のリファレンスとして、サンプルサイズ計算に関する記事をシリーズで書いています。 なるべく体裁を統一するために、以下のように決めています。

  • 群を示す添字について:
    • c, C = 対照群
    • t, T = 介入群*1
    • e, E = 要因群
    • 添字なし = 全体
  • 使用する記号:
    • p = 反応割合
    • μ = 平均値
    • σ = 標準偏差
    • Φ = 割り付け比 Nt/Nc(デフォルトは1)
    • α = αエラー(デフォルトは0.05)
    • β = βエラー(デフォルトは0.2)
    • z = 標準正規分布の累積分布関数

想定シナリオ

疾患Dに対する治療として、従来薬Cと新規薬Tのどちらが優れているだろうか?
ランダム化比較試験で患者を1:1に割り付けて、治療の奏功割合を比較したいと考えている。
これまでの知見から、従来薬Cにおける奏効割合は4%、新規薬Tにおける奏効割合は8%と見込まれる。
両側有意水準 5%, 検出力 80%として、必要なサンプルサイズはどれくらいだろうか?

想定される割合が0または1に近い場合は、正規分布へ近似する方法ではなく、Fisher正確検定(Fisher's exact test)を用いる方法が推奨される。

「想定される割合が0または1に近い」の目安は、想定される割合のいずれかについて、p(1-p) < 0.15 となる場合。 上記のシナリオだと 0.04×(1-0.04) = 0.0384 < 0.15, 0.08×(1-0.08) = 0.0736 < 0.15 なので、正確検定に基づいたサンプルサイズ計算を行うべき。

このシナリオでサンプルサイズを計算するのに必要な条件を整理してみると、以下のようになる。

  • 帰無仮説  H_0: p_T = p_C
  • 対立仮説  H_A: p_T \neq p_C
  • 有意水準:α = 0.05
  • 検出力:1-β = 0.80
  • 割り付け比:φ = 1
  • 従来薬Cの奏効割合(想定値): \hat{p}_C = 0.04
  • 新規薬Tの奏効割合(想定値): \hat{p}_T = 0.08

方法:Fisher正確検定をもとにして計算する

偶現表で少ないセルが出来てしまう場合は、χ2乗検定を使わずにFisher正確検定を使うことが推奨されているので、それに基づいて計算する。 以下のように設定して右下の [Calculate] ボタンを押す。

  • [Test family]:"Exact"を選択
  • [Statistical test]:"Proportions: Inequality, two independent groups (Fisher's exact test)"を選択
  • [Type of power analysis]:"A priori: ..."を選択(= 与えられたαエラー、βエラー、効果サイズの条件下でサンプルサイズを計算する)を選択
  • [Input parameters]:
    • [Tail(s)]:ここでは "Two"(= 両側検定)を指定。
    • [Proportion p1, p2]:ここでは0.08と0.04を指定( [Determine] ボタンを押すと左側に新しいウィンドウが引き出される。)
    • [α err prob]:有意水準(=0.05)
    • [Power (...)]:検出力(=0.8)
    • [Allocation ratio N2/N1]:割り付け比(=1)

出力結果は以下のとおり。1群あたり586例、両群で1172例必要という結果(方法1と同じ)。

おわりに

  • G*Power、慣れてくると書き留めることがなくなってきますね。

参考資料

  • 無料のサンプルサイズ計算ソフトG*Powerのトップページ。

www.psychologie.hhu.de

*1:interventionのIを使うと1と区別しにくいのでtrial