ねこすたっと

ねこの気持ちと統計について悩む筆者の備忘録的ページ。

testing

高校生のためのデータ分析入門 (27):量的変数を比較するとき、基本はt検定!

数学が苦手なうちのJKに、将来必要となるかもしれないデータ分析への抵抗感をなくしてもらう目的で記事を書くことにしました。 前回:高校生のためのデータ分析入門 (26):カテゴリー変数を比較するとき、基本はカイ2乗検定! - ねこすたっと 量的変数で比べ…

高校生のためのデータ分析入門 (26):カテゴリー変数を比較するとき、基本はカイ2乗検定!

数学が苦手なうちのJKに、将来必要となるかもしれないデータ分析への抵抗感をなくしてもらう目的で記事を書くことにしました。 前回:高校生のためのデータ分析入門 (25):P値はどうやって計算するの? - ねこすたっと ほとんどはカイ2乗検定でOK! そもそも…

高校生のためのデータ分析入門 (25):P値はどうやって計算するの?

数学が苦手なうちのJKに、将来必要となるかもしれないデータ分析への抵抗感をなくしてもらう目的で記事を書くことにしました。 前回:高校生のためのデータ分析入門 (24):離散型アウトカムの回帰モデル(後編) - ねこすたっと おさらい:P値とは 1. 直接計…

高校生のためのデータ分析入門 (10):サンプル同士を比較する

数学が苦手なうちのJKに、将来必要となるかもしれないデータ分析への抵抗感をなくしてもらう目的で記事を書くことにしました。 前回:高校生のためのデータ分析入門 (9):サンプルから推定する(後編) - ねこすたっと 関連を見るには比較が必要 サンプルを…

分散分析(ANOVA):球面性仮定

分散分析で満たすべき仮定として球面性の仮定(the assumption of sphericity)*1をよく目にしますが、きちんと勉強したことがなかったので(わかるところだけ)読んでみました。 分散分析に必要な仮定 球面性の仮定とは 2水準間の差の分散に基づいた定義方…

Hoyle拾い読み:SEMにおけるモデル設定と識別条件

構造方程式モデリング(Structural Equation Modeling, SEM)の初学者が、 タイトルの "Handbook" に誘われて買ってしまったHoyle先生の分厚い本を拾い読みしたメモです。 といっても、私にとって重すぎる内容は拾い上げられていません。 今回は "Chapter 8…

多重比較補正に対する考え方 [R]

測定されたデータをもとにして母集団を比較するときには2種類の誤りが生じる可能性があります。 第1種過誤(αエラー):本当は差がないのに「差がある」と判断してしまう誤り 第2種過誤(βエラー):本当は差があるのに「差がない」と判断してしまう誤り エ…

Brunner-Munzel検定で分布によらずに2群の代表値を比較する(brunnermunzelパッケージ)[R]

パッケージとデータの準備 brunnermunzel.test( )を使ってBrunner-Munzel検定を行う brunnermunzel.permutation.test( )を使って並べ替えBrunner-Munzel検定を行う おわりに 参考資料 少し前に連続変数の代表値比較でどの検定方法を使えばよいのか考えた。 n…

対応のない2群の代表値を比較するときに用いるべき検定方法

正規性の検定は必要? 等分散の検定は必要? サンプル数はどれくらい必要? おわりに 参考資料 「治療Aを受けた10人と治療Bを受けた10人で、1か月後の検査値Xがどちらが高いか?」というように、対応していない(同じ人でない)2群の連続変数の代表値(平均…

t分布とt検定を振り返る

T統計量とt分布 1標本のt検定(One-sample t test) 対応のあるt検定(paired t test) 対応のない2標本のt検定(Unpaired two-sample t test) おわりに 参考資料 T統計量とt分布 正規分布する母集団から標本 が得られたとき、つまり、 のとき、 が互いに独…

2×2表で関連性をみるための正確検定(Exactパッケージ)[R]

Fisher正確確率検定(Fisher's exact test) Fisher正確確率検定の問題点 固定されている周辺度数いろいろ 行も列も固定されているケース 行(あるいは列)のみ固定されているケース 合計数のみ固定されているケース Fisher正確確率検定の過剰な保守性に対処…

サンプルサイズ計算:1群の連続アウトカム(正規分布)の平均を既知の値と比較する [G*Power]

想定シナリオ 方法:t検定もとにして計算する おわりに 参考資料 自分用のリファレンスとして、サンプルサイズ計算に関する記事をシリーズで書いています。 なるべく体裁を統一するために、以下のように決めています。 群を示す添字について: c, C = 対照群…

サンプルサイズ計算:1群の連続アウトカム(正規分布)の平均を既知の値と比較する [R]

想定シナリオ 方法0:手計算 方法1:pwr.t.test( )を使って計算する 方法2:TwoSampleMean.Equality( )を使って計算する 方法3:power.prop.test( )を使って計算する おわりに 参考資料 自分用のリファレンスとして、サンプルサイズ計算に関する記事をシリー…

サンプルサイズ計算:2群の連続アウトカム(正規分布)を比較する [G*Power]

想定シナリオ 方法:t検定もとにして計算する おわりに 参考資料 自分用のリファレンスとして、サンプルサイズ計算に関する記事をシリーズで書いています。 なるべく体裁を統一するために、以下のように決めています。 群を示す添字について: c, C = 対照群…

サンプルサイズ計算:2群の連続アウトカム(正規分布)を比較する [R]

想定シナリオ 方法0:手計算 方法1:pwr.t.test( )を使って計算する 方法2:TwoSampleMean.Equality( )を使って計算する 方法3:power.prop.test( )を使って計算する おわりに 参考資料 自分用のリファレンスとして、サンプルサイズ計算に関する記事をシリー…

サンプルサイズ計算:1群の2値アウトカムの割合から母集団における割合を推定する [R]

想定シナリオ 方法0:手計算 方法1:pwr.p.test( )を使って計算する おわりに 参考資料 自分用のリファレンスとして、サンプルサイズ計算に関する記事をシリーズで書いています。 なるべく体裁を統一するために、以下のように決めています。 群を示す添字に…

サンプルサイズ計算:1群の2値アウトカムの割合を既知の割合と比較する [G*Power]

想定シナリオ 方法:二項検定をもとにして計算する おわりに 参考資料 自分用のリファレンスとして、サンプルサイズ計算に関する記事をシリーズで書いています。 なるべく体裁を統一するために、以下のように決めています。 群を示す添字について: c, C = …

サンプルサイズ計算:1群の2値アウトカムの割合を既知の割合と比較する [R]

想定シナリオ 方法0:手計算 方法1:pwr.p.test( )を使って計算する 方法2:OneSampleProportion.Equality( )を使って計算する おわりに 参考資料 自分用のリファレンスとして、サンプルサイズ計算に関する記事をシリーズで書いています。 なるべく体裁を統…

サンプルサイズ計算:2群の2値アウトカムを比較する(オッズ比)[G*Power]

想定シナリオ 方法1:Fisher正確検定をもとにして計算する 方法2:ロジスティック回帰モデルをもとにして計算する おわりに 参考資料 自分用のリファレンスとして、サンプルサイズ計算に関する記事をシリーズで書いています。 なるべく体裁を統一するために…

サンプルサイズ計算:2群の2値アウトカムを比較する(オッズ比) [R]

想定シナリオ 方法0:手計算 方法1:RelativeRisk.Equality( )を使って計算する おわりに 参考資料 自分用のリファレンスとして、サンプルサイズ計算に関する記事をシリーズで書いています。 なるべく体裁を統一するために、以下のように決めています。 群を…

サンプルサイズ計算:2群の2値アウトカムを比較する(極端な割合) [G*Power]

想定シナリオ 方法:Fisher正確検定をもとにして計算する おわりに 参考資料 自分用のリファレンスとして、サンプルサイズ計算に関する記事をシリーズで書いています。 なるべく体裁を統一するために、以下のように決めています。 群を示す添字について: c,…

サンプルサイズ計算:2群の2値アウトカムを比較する(極端な割合) [R]

想定シナリオ 方法0:手計算 方法1:ss2x2( )を使って計算する おわりに 参考資料 自分用のリファレンスとして、サンプルサイズ計算に関する記事をシリーズで書いています。 なるべく体裁を統一するために、以下のように決めています。 群を示す添字について…

サンプルサイズ計算:2群の2値アウトカムを比較する(割合の差) [G*Power]

想定シナリオ 方法1:標準正規分布を使った検定(Z-test)をもとにして計算する 方法2:χ2乗検定をもとにして計算する おわりに 参考資料 自分用のリファレンスとして、サンプルサイズ計算に関する記事をシリーズで書いています。 なるべく体裁を統一するた…

サンプルサイズ計算:2群の2値アウトカムを比較する(割合の差) [R]

想定シナリオ 方法0:手入力 方法1:pwr.2p.test( )を使って計算する 方法2:TwoSampleProportion.Equality( )を使って計算する 方法3:power.prop.test( )を使って計算する おわりに 参考資料 自分用のリファレンスとして、サンプルサイズ計算に関する記事…

Jonckheere-Terpstra検定で量的変数の傾向性をみる(clinfunパッケージ)[R]

jonckheere.test( )を使って傾向性検定を行う パーミュテーション法でP値を求める おわりに ヨンクヒール・タプストラ検定と読む。 ある変数がカテゴリーの順序に沿って単調変化しているかどうかをみる。 ノンパラメトリック検定で、Kruskal-Wallis検定と似…

Cochran-Armitage検定でカテゴリー変数の傾向性をみる(prop.trend.test関数)[R]

検定実行の事前準備 prop.trend.test( )を使って傾向性を検定する おわりに ある割合が順序に沿って単調変化しているかどうかをみたいときはCochran-Armitage検定を使う。 以下のような3群(A,B,C)で2値変数を測定したサンプルデータを作成して実行してみる…

カテゴリー変数の多群比較と多重比較補正(fmsbパッケージ)[R]

fisher.test( )を使って全体を比較する 2群ずつ対比較する pairwise.fisher.test( )を使って対比較をする 代表的な補正方法について Bonferroni法 Holm法 Hochberg法*1 おわりに 参考資料 以下のような3群(A,B,C)で2値変数を測定したサンプルデータを作成…

生存曲線をLog-rank検定で比較する(survdiff関数) [R]

survidiff()を使ってLog-rank検定を行う Log-rank検定以外の方法を使う 層別Log-rank検定を行う 3つ以上の群間で生存曲線を比較する おわりに 参考資料 生存曲線が群間で等しいかどうかを検定するときにはLog-rank検定が使われる。 これは「群間でハザード関…