ねこすたっと

ねこの気持ちと統計について悩む筆者の備忘録的ページ。

prediction/diagnostic

geom_tileを使って予測確率をヒートマップで表現する(ggplot2パッケージ)[R]

ロジスティック回帰モデルなどから予測されるアウトカム発生確率(=予測確率)をグラフで可視化したいとします。 1つの変数に対して予測確率がどのように変化していくかを示したければ、折れ線グラフにしたり、変数をカテゴリー化して棒グラフで表したりする…

予測性能指標のoptimism補正をまとめて行う(tidymodelsパッケージ, rmsパッケージ)[R]

パッケージとデータセットの準備 事前準備 bootstraps( )を使ってブートストラップサンプルを作成する 関数を定義する optimismを計算する optimism補正性能指標を計算する おわりに 参考資料 予測性能には、識別能と較正能があって、内的妥当性検証の1つと…

較正プロット(calibration plot)で較正能を評価する(rmsパッケージvar.prob関数)

パッケージとデータセットの準備 ロジスティック回帰モデルを当てはめる var.prob( )を使って較正プロットを描く 表示される性能指標 Calibration intercept & slope*2の解釈 おわりに 参考資料 広い意味で予測モデルを含め、検査は真の状態を言い当てること…

ROC解析でoptimismを補正したAUCを計算する(tidymodelsパッケージ)[R]

Optimismとは Optimism補正予測性能の求め方 tidymodelsパッケージを使ってoptimism-corrected AUROCを計算する bootstraps( )を使ってブートストラップサンプルを作成する optimismを計算する自作関数 map( )を使ってデータセットのリストに一括して適用す…

罰則付き回帰モデル(LASSO回帰, Ridge回帰, Elastic Net)で過学習を抑える(glmnetパッケージ)[R]

罰則付き回帰モデル(penalized regression model)で過学習を抑える LASSO回帰, Ridge回帰, Elastic Netは正則化項(ペナルティー)が違う glmnet( )でペナルティーの重みλを色々変えて係数βを推定する cv.glmnet( )で重み付けパラメータλを変えながらモデ…

傾向スコア解析(3):傾向スコアマッチング(PSM)を使って交絡を調整する [R]

パッケージとデータの準備 マッチング前のデータで共変量のバランスを確認する 傾向スコアでマッチさせたコホートを作成する マッチさせたコホートで共変量のバランスを確認する マッチングの様子を図示する 治療効果を推定する おわりに 参考資料 傾向スコ…

傾向スコア解析(2):傾向スコアを使った逆確率重み付け法(IPW)で交絡を調整する [R]

パッケージとデータの準備 〜 傾向スコアの推定 各症例の重み(weight)を計算する 重みが極端な値の場合の対処方法 WeightItパッケージを使う方法 共変量のバランスを確認する cobaltパッケージを使う MatchItパッケージを使う 治療効果を推定する おわりに…

傾向スコア解析(1):ロジスティック回帰モデルで傾向スコア(propensity score)を推定する [R]

傾向スコアを使った解析の流れ 傾向スコアの推定方法 傾向スコアの推定に用いる変数 パッケージとデータの準備 元データで群間のバランスを見てみる ロジスティック回帰モデルを使って傾向スコアを推定する 推定された傾向スコアを確認する 傾向スコアの分布…

ROC解析で識別能を評価する(pROCパッケージ, ggplot系ggroc関数)[R]

パッケージとデータの準備 ROC曲線下面積(AUC)を計算する ggroc( )を使ってROC曲線を描く パイプ演算子%>%を使うことも可能 2つのAUCを比較する おわりに 参考資料 検査を使って真の状態(例えばある疾患に罹患しているかどうか)や予後を予測する際に、そ…