サンプルサイズ計算：1群の2値アウトカムの割合から母集団における割合を推定する [R]

想定シナリオ方法0：手計算方法1：pwr.p.test( )を使って計算するおわりに参考資料自分用のリファレンスとして、サンプルサイズ計算に関する記事をシリーズで書いています。なるべく体裁を統一するために、以下のように決めています。群を示す添字に…

2022-08-12

サンプルサイズ計算：1群の2値アウトカムの割合を既知の割合と比較する [R]

power/sample size testing dichotomous R neco

想定シナリオ方法0：手計算方法1：pwr.p.test( )を使って計算する方法2：OneSampleProportion.Equality( )を使って計算するおわりに参考資料自分用のリファレンスとして、サンプルサイズ計算に関する記事をシリーズで書いています。なるべく体裁を統…

2022-08-10

サンプルサイズ計算：2群の2値アウトカムを比較する（オッズ比） [R]

power/sample size testing maths/theory dichotomous R neco

想定シナリオ方法0：手計算方法1：RelativeRisk.Equality( )を使って計算するおわりに参考資料自分用のリファレンスとして、サンプルサイズ計算に関する記事をシリーズで書いています。なるべく体裁を統一するために、以下のように決めています。群を…

2022-08-08

サンプルサイズ計算：2群の2値アウトカムを比較する（極端な割合） [R]

power/sample size testing maths/theory dichotomous R neco

想定シナリオ方法0：手計算方法1：ss2x2( )を使って計算するおわりに参考資料自分用のリファレンスとして、サンプルサイズ計算に関する記事をシリーズで書いています。なるべく体裁を統一するために、以下のように決めています。群を示す添字について…

2022-08-06

サンプルサイズ計算：2群の2値アウトカムを比較する（割合の差） [R]

power/sample size testing maths/theory dichotomous R neco

想定シナリオ方法0：手入力方法1：pwr.2p.test( )を使って計算する方法2：TwoSampleProportion.Equality( )を使って計算する方法3：power.prop.test( )を使って計算するおわりに参考資料自分用のリファレンスとして、サンプルサイズ計算に関する記事…

2022-07-19

回帰モデルの結果をキレイに表示する（gtsummaryパッケージtbl_regression関数）[R]

gt tidyverse figure/table reporting R neco

パッケージとデータセットの準備モデルの当てはめ tbl_regression( )で結果をキレイに表示する変数の表示名を変更する一部の変数の結果のみ表示する係数やP値の桁数を変更するモデル当てはめに関する情報を追加する表の体裁を変更する太字・イタリッ…

2022-07-18

対象者背景表Table1を作成する（gtsummaryパッケージtbl_summary関数）[R]

gt tidyverse figure/table reporting R

パッケージとデータセットの準備 tbl_summary( )でキレイな背景表を作成する群別に要約する要約統計量を変更する欠測の表示方法を変更する変数の表示名を変更する一部の変数の結果のみ表示する表示する情報を追加する表の体裁を変更する太字・イタリ…

2022-07-17

予測性能指標のoptimism補正をまとめて行う（tidymodelsパッケージ, rmsパッケージ）[R]

prediction/diagnostic tidyverse bootstrap validation R neco

パッケージとデータセットの準備事前準備 bootstraps( )を使ってブートストラップサンプルを作成する関数を定義する optimismを計算する optimism補正性能指標を計算するおわりに参考資料予測性能には、識別能と較正能があって、内的妥当性検証の1つと…

2022-07-16

生存時間データ分類(4)：Multi-state type（mstateパッケージ）[R]

survival clustered/repeated bias figure/table R

パッケージとデータセットの準備想定する多状態モデル transMat( )を使って遷移行列（transition matrix）を指定する path( )で遷移経路を確認する msprep( )でデータを縦長に変形する events( )で移行の様子を確認する coxph( )とmisfit( )を使ってモデル…

2022-07-15

柔軟なリスク回帰モデルを使った生存時間解析（timeregパッケージ, riskRegressionパッケージ）[R]

survival bias maths/theory R neco

柔軟なリスク回帰モデル（flexible risk regression model）とは色々なパッケージを使ってFine-Grayモデルを当てはめるパッケージとデータセットの準備方法1：timeregパッケージ comp.risk( )を使う方法2：riskRegressionパッケージ riskRegression( )を…

2022-07-13

生存時間データ分類(3)：Competing type（tidycmprskパッケージ）[R]

survival bias maths/theory gt figure/table R

競合リスクを含んだ生存時間解析原因別ハザードモデル（cause-specific hazard model）部分分布ハザードモデル（subdistribution hazard model） tidycmprskパッケージを使ってFine-Grayモデルに当てはめるパッケージとデータセットの準備 crr( )でモデル…

2022-07-12

生存時間データ分類(2)：Repeated type（tmerge関数）[R]

survival time-dependent clustered/repeated R neco

最終的に必要なデータ構造 tmerge( )でデータ整形する 3つのデータを用意する tstart, tstopを追加する時間依存性共変量データを追加するイベント発生データを追加する累積回数を追加する Cox比例ハザードモデルで解析するおわりに参考資料生存時間デ…

2022-07-09

較正プロット（calibration plot）で較正能を評価する（rmsパッケージvar.prob関数）

prediction/diagnostic validation figure/table R neco

パッケージとデータセットの準備ロジスティック回帰モデルを当てはめる var.prob( )を使って較正プロットを描く表示される性能指標 Calibration intercept & slope*2の解釈おわりに参考資料広い意味で予測モデルを含め、検査は真の状態を言い当てること…

2022-07-04

マルチレベルデータの解析方法(3)：一般化推定方程式（GEE）と混合効果モデル（MEM）のどちらを使うべきか

clustered/repeated maths/theory missing bias R

マルチレベルデータの解析推定方法の概要最尤推定法（Maximum Likelihood Estimation, MLE）制限付き最尤推定法（Restricted Maximum Likelihood Estimation, REML）一般化推定方程式（Generalized Estimating Equations, GEE） GEE vs. MEM 興味の対象 …

2022-07-02

データ構造を要約・説明する(1)：探索的因子分析（psychパッケージ）[R]

latent variable maths/theory figure/table R

データの構造を要約・説明する手法探索的因子分析の手順使用するパッケージとデータセット 1. データの評価 KMO統計量相関係数 2. 因子数の決定 VSS()を使ってMAP, BICに基づいた因子数を選択する fa.parallel( )を使って平行分析で因子数を選択する 3. …

2022-07-01

ROC解析でoptimismを補正したAUCを計算する（tidymodelsパッケージ）[R]

prediction/diagnostic bootstrap bias validation tidyverse R neco

Optimismとは Optimism補正予測性能の求め方 tidymodelsパッケージを使ってoptimism-corrected AUROCを計算する bootstraps( )を使ってブートストラップサンプルを作成する optimismを計算する自作関数 map( )を使ってデータセットのリストに一括して適用す…

2022-05-08

データ構造を要約・説明する(2)：検証的因子分析（lavaanパッケージなど）[R]

latent variable validation maths/theory R neco

因子分析とは検証的因子分析の手順使用するパッケージとデータセット 1. データの確認 2. 因子構造の指定 3. モデルの当てはめ 4. 推定結果の確認 4-1. 推定の概要 4-2. モデルの適合度 4-3. 推定値 4-4. パス図を描く 5. モデルの改善 5-1. 当てはまりの…

2022-04-11

Kaplan-Meier生存曲線をキレイに描く（ggplot系jskmパッケージ）[R]

survival ggplot figure/table R neco

jskm( )を使ってKaplan-Meier生存曲線を描く信頼区間をつける色パレットを変更する線の種類を変更する打ち切りマークを変更する Risk tableをつける軸について色々軸の目盛り間隔を変更する軸の範囲・ラベルを指定する検定結果を表示する凡例を変更…

2022-04-10

ブートストラップ（bootstrap）法で信頼区間を求める（bootパッケージ）[R]

bootstrap maths/theory bias R

例示のための元データの作成 bootパッケージを使って信頼区間を計算する boot( )を使ってブートストラップサンプル毎の統計量を計算する boot.ci( )を使ってブートストラップ信頼区間を計算する信頼区間を計算するアルゴリズム色々表記のルールバイアス …

2022-04-09

マルチレベルデータの解析方法(2)：混合効果モデル（lme4パッケージ）

clustered/repeated maths/theory R neco

マルチレベルデータとはマルチレベルデータの解析混合効果モデルの概要混合効果モデル = 固定効果 + 変量効果クラスター効果をモデルに含める lme4パッケージで混合効果モデルを使うサンプルデータの準備 glmer( )を使ってモデルを当てはめるランダム…

2022-04-08

マルチレベルデータの解析方法(1)：一般化推定方程式GEE（geepackパッケージ）

clustered/repeated maths/theory tidyverse R

マルチレベルデータとはマルチレベルデータの解析一般化推定方程式（GEE）の概要独立型：independent 交換可能型：exchangeable 1次自己相関型：AR(1) 非構造化型：unstructured geepackパッケージで一般化推定方程式（GEE）を使うサンプルデータの準備 …

2022-04-07

罰則付き回帰モデル（LASSO回帰, Ridge回帰, Elastic Net）で過学習を抑える（glmnetパッケージ）[R]

variable selection prediction/diagnostic validation R neco

罰則付き回帰モデル（penalized regression model）で過学習を抑える LASSO回帰, Ridge回帰, Elastic Netは正則化項（ペナルティー）が違う glmnet( )でペナルティーの重みλを色々変えて係数βを推定する cv.glmnet( )で重み付けパラメータλを変えながらモデ…

2022-04-06

傾向スコア解析(3)：傾向スコアマッチング（PSM）を使って交絡を調整する [R]

quasi-experiment prediction/diagnostic matching/paired R

パッケージとデータの準備マッチング前のデータで共変量のバランスを確認する傾向スコアでマッチさせたコホートを作成するマッチさせたコホートで共変量のバランスを確認するマッチングの様子を図示する治療効果を推定するおわりに参考資料傾向スコ…

2022-04-05

傾向スコア解析(2)：傾向スコアを使った逆確率重み付け法（IPW）で交絡を調整する [R]

quasi-experiment prediction/diagnostic maths/theory R neco

パッケージとデータの準備〜傾向スコアの推定各症例の重み（weight）を計算する重みが極端な値の場合の対処方法 WeightItパッケージを使う方法共変量のバランスを確認する cobaltパッケージを使う MatchItパッケージを使う治療効果を推定するおわりに…

2022-04-04

傾向スコア解析(1)：ロジスティック回帰モデルで傾向スコア（propensity score）を推定する [R]

quasi-experiment prediction/diagnostic validation R

傾向スコアを使った解析の流れ傾向スコアの推定方法傾向スコアの推定に用いる変数パッケージとデータの準備元データで群間のバランスを見てみるロジスティック回帰モデルを使って傾向スコアを推定する推定された傾向スコアを確認する傾向スコアの分布…

2022-04-03

2値アウトカムに対する回帰モデルいろいろ(3)：Stanを使ったベイズ統計モデリング[R]

dichotomous Bayes/Stan maths/theory R neco

パッケージとデータの準備 Stanファイルの準備おわりに参考文献前回、ロジスティック回帰モデル（ロジット-二項モデル）からオッズ比（odds ratio, OR）ではなくリスク比（risk ratio, RR）を推定する方法として「デルタ法」と「ブートストラップ法」を用…

2022-04-02

2値アウトカムに対する回帰モデルいろいろ(2)：デルタ法・ブートストラップ法[R]

dichotomous bootstrap maths/theory R

パッケージとデータの準備デルタ法ブートストラップ法おわりに参考資料今回はロジスティック回帰モデル（ロジット-二項モデル）からオッズ比（odds ratio, OR）ではなくリスク比（risk ratio, RR）を推定する方法をまとめる。ロジスティック回帰モデル…

2022-04-01

2値アウトカムに対する回帰モデルいろいろ(1)：glm関数とロバスト分散推定法[R]

maths/theory dichotomous tidyverse reporting R neco

アウトカムが2値変数の場合、一般的にロジスティック回帰モデルが用いられることが多い。この場合の効果指標はオッズ比（odds ration, OR）だが、アウトカムの発生頻度が高い場合（>10%ルール）、オッズ比はリスク比（risk ratio, RR）の近似にならない。 …

2021-10-25

カラーパレットで色を指定する（RColorBrewer, viridis, ggsciパッケージ）[R]

ggplot figure/table reporting R neco

グレースケールで描く RColorBrewerパッケージ viridisパッケージ ggsciパッケージ Nature Publishing Groups The New England Journal of Medicine (NEJM) Lancet The Journal of the American Medical Association (JAMA) Journal of Clinical Oncology 色…

2021-10-24

時系列データをグラフにする（ggplot2パッケージ）[R]

ggplot figure/table temporal R

時間・順序と組になっている変量をグラフにする geom_area( )で面グラフを描く geom_line( )で折れ線グラフを描く geom_ribbon( )でリボンプロットを描く geom_step( )で階段状プロットを描く geom_path( )で経路を表示するおわりに参考資料時間・順序と…

ねこすたっと

ねこの気持ちと統計について悩む筆者の備忘録的ページ。

R

サンプルサイズ計算：1群の2値アウトカムの割合から母集団における割合を推定する [R]

サンプルサイズ計算：1群の2値アウトカムの割合を既知の割合と比較する [R]

サンプルサイズ計算：2群の2値アウトカムを比較する（オッズ比） [R]

サンプルサイズ計算：2群の2値アウトカムを比較する（極端な割合） [R]

サンプルサイズ計算：2群の2値アウトカムを比較する（割合の差） [R]

回帰モデルの結果をキレイに表示する（gtsummaryパッケージtbl_regression関数）[R]

対象者背景表Table1を作成する（gtsummaryパッケージtbl_summary関数）[R]

予測性能指標のoptimism補正をまとめて行う（tidymodelsパッケージ, rmsパッケージ）[R]

生存時間データ分類(4)：Multi-state type（mstateパッケージ）[R]

柔軟なリスク回帰モデルを使った生存時間解析（timeregパッケージ, riskRegressionパッケージ）[R]

生存時間データ分類(3)：Competing type（tidycmprskパッケージ）[R]

生存時間データ分類(2)：Repeated type（tmerge関数）[R]

較正プロット（calibration plot）で較正能を評価する（rmsパッケージvar.prob関数）

マルチレベルデータの解析方法(3)：一般化推定方程式（GEE）と混合効果モデル（MEM）のどちらを使うべきか

データ構造を要約・説明する(1)：探索的因子分析（psychパッケージ）[R]

ROC解析でoptimismを補正したAUCを計算する（tidymodelsパッケージ）[R]

データ構造を要約・説明する(2)：検証的因子分析（lavaanパッケージなど）[R]

Kaplan-Meier生存曲線をキレイに描く（ggplot系jskmパッケージ）[R]

ブートストラップ（bootstrap）法で信頼区間を求める（bootパッケージ）[R]

マルチレベルデータの解析方法(2)：混合効果モデル（lme4パッケージ）

マルチレベルデータの解析方法(1)：一般化推定方程式GEE（geepackパッケージ）

罰則付き回帰モデル（LASSO回帰, Ridge回帰, Elastic Net）で過学習を抑える（glmnetパッケージ）[R]

傾向スコア解析(3)：傾向スコアマッチング（PSM）を使って交絡を調整する [R]

傾向スコア解析(2)：傾向スコアを使った逆確率重み付け法（IPW）で交絡を調整する [R]

傾向スコア解析(1)：ロジスティック回帰モデルで傾向スコア（propensity score）を推定する [R]

2値アウトカムに対する回帰モデルいろいろ(3)：Stanを使ったベイズ統計モデリング[R]

2値アウトカムに対する回帰モデルいろいろ(2)：デルタ法・ブートストラップ法[R]

2値アウトカムに対する回帰モデルいろいろ(1)：glm関数とロバスト分散推定法[R]

カラーパレットで色を指定する（RColorBrewer, viridis, ggsciパッケージ）[R]

時系列データをグラフにする（ggplot2パッケージ）[R]