ねこすたっと

ねこの気持ちと統計について悩む筆者の備忘録的ページ。

maths/theory

サンプルサイズ計算:2群の2値アウトカムを比較する(極端な割合) [R]

想定シナリオ 方法0:手計算 方法1:ss2x2( )を使って計算する おわりに 参考資料 自分用のリファレンスとして、サンプルサイズ計算に関する記事をシリーズで書いています。 なるべく体裁を統一するために、以下のように決めています。 群を示す添字について…

サンプルサイズ計算:2群の2値アウトカムを比較する(割合の差) [R]

想定シナリオ 方法0:手入力 方法1:pwr.2p.test( )を使って計算する 方法2:TwoSampleProportion.Equality( )を使って計算する 方法3:power.prop.test( )を使って計算する おわりに 参考資料 自分用のリファレンスとして、サンプルサイズ計算に関する記事…

柔軟なリスク回帰モデルを使った生存時間解析(timeregパッケージ, riskRegressionパッケージ)[R]

柔軟なリスク回帰モデル(flexible risk regression model)とは 色々なパッケージを使ってFine-Grayモデルを当てはめる パッケージとデータセットの準備 方法1:timeregパッケージ comp.risk( )を使う 方法2:riskRegressionパッケージ riskRegression( )を…

生存時間データ分類(3):Competing type(tidycmprskパッケージ)[R]

競合リスクを含んだ生存時間解析 原因別ハザードモデル(cause-specific hazard model) 部分分布ハザードモデル(subdistribution hazard model) tidycmprskパッケージを使ってFine-Grayモデルに当てはめる パッケージとデータセットの準備 crr( )でモデル…

生存時間データ分類(1):生存時間データには4つのタイプがある

イベント1種類, 1人1回まで(単純型, simple type) イベント1種類, 1人2回以上可(反復型, repeated type) イベント複数種類, 1人1回まで(競合型, competing type) イベント複数種類, 1人2回以上可(多状態型, multi-state type) おわりに 参考資料 The…

生存時間解析にまつわる関数のおさらい

関数同士の関係式 定義 ハザード関数 累積ハザード関数 ハザード関数・累積ハザード関数を使う理由 解釈上の利点 解析上の利点 競合リスクがあるときに生じる問題 おわりに 参考資料 生存時間の解析方法を読んでいると色々な関数が登場するので、関係性含め…

マルチレベルデータの解析方法(3):一般化推定方程式(GEE)と混合効果モデル(MEM)のどちらを使うべきか

マルチレベルデータの解析 推定方法の概要 最尤推定法(Maximum Likelihood Estimation, MLE) 制限付き最尤推定法(Restricted Maximum Likelihood Estimation, REML) 一般化推定方程式(Generalized Estimating Equations, GEE) GEE vs. MEM 興味の対象 …

データ構造を要約・説明する(1):探索的因子分析(psychパッケージ)[R]

データの構造を要約・説明する手法 探索的因子分析の手順 使用するパッケージとデータセット 1. データの評価 KMO統計量 相関係数 2. 因子数の決定 VSS()を使ってMAP, BICに基づいた因子数を選択する fa.parallel( )を使って平行分析で因子数を選択する 3. …

データ構造を要約・説明する(2):検証的因子分析(lavaanパッケージなど)[R]

因子分析とは 検証的因子分析の手順 使用するパッケージとデータセット 1. データの確認 2. 因子構造の指定 3. モデルの当てはめ 4. 推定結果の確認 4-1. 推定の概要 4-2. モデルの適合度 4-3. 推定値 4-4. パス図を描く 5. モデルの改善 5-1. 当てはまりの…

ブートストラップ(bootstrap)法で信頼区間を求める(bootパッケージ)[R]

例示のための元データの作成 bootパッケージを使って信頼区間を計算する boot( )を使ってブートストラップサンプル毎の統計量を計算する boot.ci( )を使ってブートストラップ信頼区間を計算する 信頼区間を計算するアルゴリズム色々 表記のルール バイアス …

マルチレベルデータの解析方法(2):混合効果モデル(lme4パッケージ)

マルチレベルデータとは マルチレベルデータの解析 混合効果モデルの概要 混合効果モデル = 固定効果 + 変量効果 クラスター効果をモデルに含める lme4パッケージで混合効果モデルを使う サンプルデータの準備 glmer( )を使ってモデルを当てはめる ランダム…

マルチレベルデータの解析方法(1):一般化推定方程式GEE(geepackパッケージ)

マルチレベルデータとは マルチレベルデータの解析 一般化推定方程式(GEE)の概要 独立型:independent 交換可能型:exchangeable 1次自己相関型:AR(1) 非構造化型:unstructured geepackパッケージで一般化推定方程式(GEE)を使う サンプルデータの準備 …

傾向スコア解析(2):傾向スコアを使った逆確率重み付け法(IPW)で交絡を調整する [R]

パッケージとデータの準備 〜 傾向スコアの推定 各症例の重み(weight)を計算する 重みが極端な値の場合の対処方法 WeightItパッケージを使う方法 共変量のバランスを確認する cobaltパッケージを使う MatchItパッケージを使う 治療効果を推定する おわりに…

2値アウトカムに対する回帰モデルいろいろ(3):Stanを使ったベイズ統計モデリング[R]

パッケージとデータの準備 Stanファイルの準備 おわりに 参考文献 前回、ロジスティック回帰モデル(ロジット-二項モデル)からオッズ比(odds ratio, OR)ではなくリスク比(risk ratio, RR)を推定する方法として「デルタ法」と「ブートストラップ法」を用…

2値アウトカムに対する回帰モデルいろいろ(2):デルタ法・ブートストラップ法[R]

パッケージとデータの準備 デルタ法 ブートストラップ法 おわりに 参考資料 今回はロジスティック回帰モデル(ロジット-二項モデル)からオッズ比(odds ratio, OR)ではなくリスク比(risk ratio, RR)を推定する方法をまとめる。 ロジスティック回帰モデル…

2値アウトカムに対する回帰モデルいろいろ(1):glm関数とロバスト分散推定法[R]

アウトカムが2値変数の場合、一般的にロジスティック回帰モデルが用いられることが多い。 この場合の効果指標はオッズ比(odds ration, OR)だが、アウトカムの発生頻度が高い場合(>10%ルール)、オッズ比はリスク比(risk ratio, RR)の近似にならない。 …