サンプルサイズ計算：1群の2値アウトカムの割合から母集団における割合を推定する [R]

想定シナリオ方法0：手計算方法1：pwr.p.test( )を使って計算するおわりに参考資料自分用のリファレンスとして、サンプルサイズ計算に関する記事をシリーズで書いています。なるべく体裁を統一するために、以下のように決めています。群を示す添字に…

2022-08-12

サンプルサイズ計算：1群の2値アウトカムの割合を既知の割合と比較する [R]

power/sample size testing dichotomous R neco

想定シナリオ方法0：手計算方法1：pwr.p.test( )を使って計算する方法2：OneSampleProportion.Equality( )を使って計算するおわりに参考資料自分用のリファレンスとして、サンプルサイズ計算に関する記事をシリーズで書いています。なるべく体裁を統…

2022-08-10

サンプルサイズ計算：2群の2値アウトカムを比較する（オッズ比） [R]

power/sample size testing maths/theory dichotomous R neco

想定シナリオ方法0：手計算方法1：RelativeRisk.Equality( )を使って計算するおわりに参考資料自分用のリファレンスとして、サンプルサイズ計算に関する記事をシリーズで書いています。なるべく体裁を統一するために、以下のように決めています。群を…

2022-08-08

サンプルサイズ計算：2群の2値アウトカムを比較する（極端な割合） [R]

power/sample size testing maths/theory dichotomous R neco

想定シナリオ方法0：手計算方法1：ss2x2( )を使って計算するおわりに参考資料自分用のリファレンスとして、サンプルサイズ計算に関する記事をシリーズで書いています。なるべく体裁を統一するために、以下のように決めています。群を示す添字について…

2022-08-06

サンプルサイズ計算：2群の2値アウトカムを比較する（割合の差） [R]

power/sample size testing maths/theory dichotomous R neco

想定シナリオ方法0：手入力方法1：pwr.2p.test( )を使って計算する方法2：TwoSampleProportion.Equality( )を使って計算する方法3：power.prop.test( )を使って計算するおわりに参考資料自分用のリファレンスとして、サンプルサイズ計算に関する記事…

2022-07-19

回帰モデルの結果をキレイに表示する（gtsummaryパッケージtbl_regression関数）[R]

gt tidyverse figure/table reporting R neco

パッケージとデータセットの準備モデルの当てはめ tbl_regression( )で結果をキレイに表示する変数の表示名を変更する一部の変数の結果のみ表示する係数やP値の桁数を変更するモデル当てはめに関する情報を追加する表の体裁を変更する太字・イタリッ…

2022-07-17

予測性能指標のoptimism補正をまとめて行う（tidymodelsパッケージ, rmsパッケージ）[R]

prediction/diagnostic tidyverse bootstrap validation R neco

パッケージとデータセットの準備事前準備 bootstraps( )を使ってブートストラップサンプルを作成する関数を定義する optimismを計算する optimism補正性能指標を計算するおわりに参考資料予測性能には、識別能と較正能があって、内的妥当性検証の1つと…

2022-07-15

柔軟なリスク回帰モデルを使った生存時間解析（timeregパッケージ, riskRegressionパッケージ）[R]

survival bias maths/theory R neco

柔軟なリスク回帰モデル（flexible risk regression model）とは色々なパッケージを使ってFine-Grayモデルを当てはめるパッケージとデータセットの準備方法1：timeregパッケージ comp.risk( )を使う方法2：riskRegressionパッケージ riskRegression( )を…

2022-07-12

生存時間データ分類(2)：Repeated type（tmerge関数）[R]

survival time-dependent clustered/repeated R neco

最終的に必要なデータ構造 tmerge( )でデータ整形する 3つのデータを用意する tstart, tstopを追加する時間依存性共変量データを追加するイベント発生データを追加する累積回数を追加する Cox比例ハザードモデルで解析するおわりに参考資料生存時間デ…

2022-07-09

較正プロット（calibration plot）で較正能を評価する（rmsパッケージvar.prob関数）

prediction/diagnostic validation figure/table R neco

パッケージとデータセットの準備ロジスティック回帰モデルを当てはめる var.prob( )を使って較正プロットを描く表示される性能指標 Calibration intercept & slope*2の解釈おわりに参考資料広い意味で予測モデルを含め、検査は真の状態を言い当てること…

2022-07-05

画像を指定された解像度（dpi）を変更する

figure/table reporting neco

画像データを投稿するときに確認すること画像のフォーマットいろいろベクター画像ビットマップ画像解像度の確認・変更方法 Macの場合 Windowsの場合おわりに参考資料画像データを投稿するときに確認すること Webページを作るわけでもなく、イラストを…

2022-07-01

ROC解析でoptimismを補正したAUCを計算する（tidymodelsパッケージ）[R]

prediction/diagnostic bootstrap bias validation tidyverse R neco

Optimismとは Optimism補正予測性能の求め方 tidymodelsパッケージを使ってoptimism-corrected AUROCを計算する bootstraps( )を使ってブートストラップサンプルを作成する optimismを計算する自作関数 map( )を使ってデータセットのリストに一括して適用す…

2022-05-08

データ構造を要約・説明する(2)：検証的因子分析（lavaanパッケージなど）[R]

latent variable validation maths/theory R neco

因子分析とは検証的因子分析の手順使用するパッケージとデータセット 1. データの確認 2. 因子構造の指定 3. モデルの当てはめ 4. 推定結果の確認 4-1. 推定の概要 4-2. モデルの適合度 4-3. 推定値 4-4. パス図を描く 5. モデルの改善 5-1. 当てはまりの…

2022-04-11

Kaplan-Meier生存曲線をキレイに描く（ggplot系jskmパッケージ）[R]

survival ggplot figure/table R neco

jskm( )を使ってKaplan-Meier生存曲線を描く信頼区間をつける色パレットを変更する線の種類を変更する打ち切りマークを変更する Risk tableをつける軸について色々軸の目盛り間隔を変更する軸の範囲・ラベルを指定する検定結果を表示する凡例を変更…

2022-04-09

マルチレベルデータの解析方法(2)：混合効果モデル（lme4パッケージ）

clustered/repeated maths/theory R neco

マルチレベルデータとはマルチレベルデータの解析混合効果モデルの概要混合効果モデル = 固定効果 + 変量効果クラスター効果をモデルに含める lme4パッケージで混合効果モデルを使うサンプルデータの準備 glmer( )を使ってモデルを当てはめるランダム…

2022-04-07

罰則付き回帰モデル（LASSO回帰, Ridge回帰, Elastic Net）で過学習を抑える（glmnetパッケージ）[R]

variable selection prediction/diagnostic validation R neco

罰則付き回帰モデル（penalized regression model）で過学習を抑える LASSO回帰, Ridge回帰, Elastic Netは正則化項（ペナルティー）が違う glmnet( )でペナルティーの重みλを色々変えて係数βを推定する cv.glmnet( )で重み付けパラメータλを変えながらモデ…

2022-04-05

傾向スコア解析(2)：傾向スコアを使った逆確率重み付け法（IPW）で交絡を調整する [R]

quasi-experiment prediction/diagnostic maths/theory R neco

パッケージとデータの準備〜傾向スコアの推定各症例の重み（weight）を計算する重みが極端な値の場合の対処方法 WeightItパッケージを使う方法共変量のバランスを確認する cobaltパッケージを使う MatchItパッケージを使う治療効果を推定するおわりに…

2022-04-03

2値アウトカムに対する回帰モデルいろいろ(3)：Stanを使ったベイズ統計モデリング[R]

dichotomous Bayes/Stan maths/theory R neco

パッケージとデータの準備 Stanファイルの準備おわりに参考文献前回、ロジスティック回帰モデル（ロジット-二項モデル）からオッズ比（odds ratio, OR）ではなくリスク比（risk ratio, RR）を推定する方法として「デルタ法」と「ブートストラップ法」を用…

2022-04-01

2値アウトカムに対する回帰モデルいろいろ(1)：glm関数とロバスト分散推定法[R]

maths/theory dichotomous tidyverse reporting R neco

アウトカムが2値変数の場合、一般的にロジスティック回帰モデルが用いられることが多い。この場合の効果指標はオッズ比（odds ration, OR）だが、アウトカムの発生頻度が高い場合（>10%ルール）、オッズ比はリスク比（risk ratio, RR）の近似にならない。 …

2021-10-25

カラーパレットで色を指定する（RColorBrewer, viridis, ggsciパッケージ）[R]

ggplot figure/table reporting R neco

グレースケールで描く RColorBrewerパッケージ viridisパッケージ ggsciパッケージ Nature Publishing Groups The New England Journal of Medicine (NEJM) Lancet The Journal of the American Medical Association (JAMA) Journal of Clinical Oncology 色…

2021-10-23

1つの連続変数と1つのカテゴリー変数をグラフにする（ggplot2パッケージ）[R]

ggplot figure/table R neco

geom_boxplot( )を使って箱ヒゲ図を描く箱の形状に関する指定箱の色・線種に関する指定外れ値に関する指定 geom_violin( )でバイオリンプロットを描く stat_*( )との対応おわりに参考資料 ggplot2パッケージ（tidyverseパッケージに含まれている）のdia…

2021-10-21

2つのカテゴリー変数をグラフにする（ggplot2パッケージ）[R]

ggplot figure/table R neco

geom_jitter( )で点をずらして描く geom_count( )で各カテゴリーの合計数をプロットする stat_sum( )との対応おわりに参考資料 ggplot2パッケージ（tidyverseパッケージに含まれている）のdiamondsデータを使う。 > library(tidyverse) > head(diamonds) #…

2021-10-19

1つのカテゴリー変数をグラフにする（ggplot2パッケージ）[R]

ggplot figure/table R neco

geom_bar( )を使って棒グラフを描く geom_bar( )の引数を指定する stat_count( )との対応おわりに参考資料 ggplot2パッケージ（tidyverseパッケージに含まれている）のdiamondsデータを使う。 > library(tidyverse) > head(diamonds) # A tibble: 6 x 10 c…

2021-10-17

多重代入法(4)：補完後データを解析する（miceパッケージ）[R]

missing data handling tidyverse R neco

基本：mice( )→with( )→pool( ) 別の方法1：mice( )→complete( )→by( ) 別の方法2：mice( )→group_by( )→do( ) おわりに参考資料多重代入法を使ったデータ解析の流れのおさらい。図1：多重補完を使ったデータ解析の流れ基本的には、(1)mice( )で作成した…