自分用のリファレンスとして、サンプルサイズ計算に関する記事をシリーズで書いています。 なるべく体裁を統一するために、以下のように決めています。
- 群を示す添字について:
- c, C = 対照群
- t, T = 介入群*1
- e, E = 要因群
- 添字なし = 全体
- 使用する記号:
- p = 反応割合
- μ = 平均値
- σ = 標準偏差
- Φ = 割り付け比 Nt/Nc(デフォルトは1)
- α = αエラー(デフォルトは0.05)
- β = βエラー(デフォルトは0.2)
- z = 標準正規分布の累積分布関数
想定シナリオ
疾患Dに対する治療として、従来薬Cと新規薬Tのどちらが優れているだろうか?
従来薬Cについては既に多くの研究が行われており、治療後の疾患活動度スコアが60点となることが分かっている。 そこで今回の研究では、患者全員に新規薬Tを投与して、従来薬Cの疾患活動度スコア 60点と比較したい。 またこれまでの知見から、新規薬Tにおける疾患活動度スコアは50点となることが見込まれる。 両側有意水準 5%, 検出力 80%として、必要なサンプルサイズはどれくらいだろうか?
このシナリオでサンプルサイズを計算するのに必要な条件を整理してみると、以下のようになる。
- 帰無仮説
- 対立仮説
- 有意水準:α = 0.05
- 検出力:1-β = 0.80
- 従来薬C群における治療後活動度スコアの平均値(既知の値): = 60
- 新規薬T群における治療後活動度スコアの平均値(想定値): = 50
- 新規薬T群における活動度スコアの標準偏差(想定値): = 10
新規薬Tの効果は、2群の平均値の差 で推定され、効果サイズと呼ばれる。 効果サイズの大小は、スコアのバラツキ具合、つまり標準偏差 (standard deviation, SD)と比べて相対的に判断する必要があるので、
で計算される「標準効果サイズ(別名:Cohen's d) 」が用いられる。
標準効果サイズは現実的には0.1-1.0の範囲で設定され、目安は以下のとおり。
- Δ=0.2:効果が小さい
- Δ=0.5:効果は中等度
- Δ=0.8:効果が大きい
方法:t検定もとにして計算する
無料のサンプルサイズ計算ソフトG*Powerを使って計算する。 以下のように設定して右下の [Calculate] ボタンを押す。
- [Test family]:"t test"を選択
- [Statistical test]:"Means: Difference from constant (one sample case)"を選択
- [Type of power analysis]:"A priori: ..."(= 与えられたαエラー、βエラー、効果サイズの条件下でサンプルサイズを計算する)を選択
- [Input parameters]:
- [Tail(s)]:ここでは "Two"(= 両側検定)を指定。
- [Effect size d]:標準化効果サイズ。ここでは1を指定。[Determine] ボタンを押せば、左に新しいウィンドウが引き出される。既知の値を"Mean H0", 試験群で想定する値を"Mean H1"に入力。"SD σ"に想定する標準偏差を入力して [Calculate and transfer to main window] ボタンを押せば、この欄の値を埋めてくれる。
- [α err prob]:有意水準(=0.05)
- [Power (...)]:検出力(=0.8)
出力結果画面は下のようになる。10例必要という結果になった。
おわりに
- サンプルサイズ計算を順番にやっていくつもりでしたが、シンプルなものを終えた段階で力尽きました。
- クラスターデザイン、クロスオーバーデザイン、非劣性・同等性、生存時間解析、診断精度研究のサンプルサイズ計算は今後頑張りたいと思います。
- ネコを飼いたいけど諸事情で飼えない方、岩合光昭さんの「世界ネコ歩き(NHK BSP)」は良いサプリメントになりますよ!
参考資料
- 奥村先生の効果サイズに関する記事です。
- 無料のサンプルサイズ計算ソフトG*Powerのトップページ。
*1:interventionのIを使うと1と区別しにくいのでtrial