ねこすたっと

ねこの気持ちと統計について悩む筆者の備忘録的ページ。

figure/table

チュートリアル拾い読み (12):Pandas公式チュートリアル (7/7) [Python]

Rもたいして使いこなせてないのにPythonの勉強を始めてみました。色々と素晴らしいチュートリアルはありそうですが、目移りしてしまうので公式チュートリアルを拾い読みしていきます。 NumPyのあとPandasチートシート(PDF)を中心に読んできましたが、今回…

RでTeX表記を使う(latex2expパッケージ)[R]

Tex( )でLaTeX表記を使う LaTeX表記の方法 おわりに 参考資料 文字や図版などの要素を紙面に配置するという作業を「組版」というが、TeXはこの作業を行うために開発された言語。 LaTeX(ラテフ, ラテク)はTeXを使いやすくした無料の文書処理システムで、数…

回帰モデルの結果をキレイに表示する(gtsummaryパッケージtbl_regression関数)[R]

パッケージとデータセットの準備 モデルの当てはめ tbl_regression( )で結果をキレイに表示する 変数の表示名を変更する 一部の変数の結果のみ表示する 係数やP値の桁数を変更する モデル当てはめに関する情報を追加する 表の体裁を変更する 太字・イタリッ…

対象者背景表Table1を作成する(gtsummaryパッケージtbl_summary関数)[R]

パッケージとデータセットの準備 tbl_summary( )でキレイな背景表を作成する 群別に要約する 要約統計量を変更する 欠測の表示方法を変更する 変数の表示名を変更する 一部の変数の結果のみ表示する 表示する情報を追加する 表の体裁を変更する 太字・イタリ…

生存時間データ分類(4):Multi-state type(mstateパッケージ)[R]

パッケージとデータセットの準備 想定する多状態モデル transMat( )を使って遷移行列(transition matrix)を指定する path( )で遷移経路を確認する msprep( )でデータを縦長に変形する events( )で移行の様子を確認する coxph( )とmisfit( )を使ってモデル…

生存時間データ分類(3):Competing type(tidycmprskパッケージ)[R]

競合リスクを含んだ生存時間解析 原因別ハザードモデル(cause-specific hazard model) 部分分布ハザードモデル(subdistribution hazard model) tidycmprskパッケージを使ってFine-Grayモデルに当てはめる パッケージとデータセットの準備 crr( )でモデル…

較正プロット(calibration plot)で較正能を評価する(rmsパッケージvar.prob関数)

パッケージとデータセットの準備 ロジスティック回帰モデルを当てはめる var.prob( )を使って較正プロットを描く 表示される性能指標 Calibration intercept & slope*2の解釈 おわりに 参考資料 広い意味で予測モデルを含め、検査は真の状態を言い当てること…

画像を指定された解像度(dpi)を変更する

画像データを投稿するときに確認すること 画像のフォーマットいろいろ ベクター画像 ビットマップ画像 解像度の確認・変更方法 Macの場合 Windowsの場合 おわりに 参考資料 画像データを投稿するときに確認すること Webページを作るわけでもなく、イラストを…

データ構造を要約・説明する(1):探索的因子分析(psychパッケージ)[R]

データの構造を要約・説明する手法 探索的因子分析の手順 使用するパッケージとデータセット 1. データの評価 KMO統計量 相関係数 2. 因子数の決定 VSS()を使ってMAP, BICに基づいた因子数を選択する fa.parallel( )を使って平行分析で因子数を選択する 3. …

Kaplan-Meier生存曲線をキレイに描く(ggplot系jskmパッケージ)[R]

jskm( )を使ってKaplan-Meier生存曲線を描く 信頼区間をつける 色パレットを変更する 線の種類を変更する 打ち切りマークを変更する Risk tableをつける 軸について色々 軸の目盛り間隔を変更する 軸の範囲・ラベルを指定する 検定結果を表示する 凡例を変更…

カラーパレットで色を指定する(RColorBrewer, viridis, ggsciパッケージ)[R]

グレースケールで描く RColorBrewerパッケージ viridisパッケージ ggsciパッケージ Nature Publishing Groups The New England Journal of Medicine (NEJM) Lancet The Journal of the American Medical Association (JAMA) Journal of Clinical Oncology 色…

時系列データをグラフにする(ggplot2パッケージ)[R]

時間・順序と組になっている変量をグラフにする geom_area( )で面グラフを描く geom_line( )で折れ線グラフを描く geom_ribbon( )でリボンプロットを描く geom_step( )で階段状プロットを描く geom_path( )で経路を表示する おわりに 参考資料 時間・順序と…

1つの連続変数と1つのカテゴリー変数をグラフにする(ggplot2パッケージ)[R]

geom_boxplot( )を使って箱ヒゲ図を描く 箱の形状に関する指定 箱の色・線種に関する指定 外れ値に関する指定 geom_violin( )でバイオリンプロットを描く stat_*( )との対応 おわりに 参考資料 ggplot2パッケージ(tidyverseパッケージに含まれている)のdia…

2つの連続変数をグラフにする(ggplot2パッケージ)[R]

geom_point( )で散布図を描く geom_smooth( )で回帰直線・曲線を描く geom_rug( )で周辺ラグプロットを描く おわりに 参考資料 ggplot2パッケージ(tidyverseパッケージに含まれている)のdiamondsデータを使う。 > library(tidyverse) > head(diamonds) # A…

2つのカテゴリー変数をグラフにする(ggplot2パッケージ)[R]

geom_jitter( )で点をずらして描く geom_count( )で各カテゴリーの合計数をプロットする stat_sum( )との対応 おわりに 参考資料 ggplot2パッケージ(tidyverseパッケージに含まれている)のdiamondsデータを使う。 > library(tidyverse) > head(diamonds) #…

1つの連続変数をグラフにする(ggplot2パッケージ)[R]

geom_histogram( )を使ってヒストグラムを描く geom_area( )を使って面グラフを描く geom_freqplot( )を使って折れ線グラフを描く geom_density( )を使って密度プロットを描く stat_bin( )との対応しているgeom_*関数 おわりに 参考資料 ggplot2パッケージ(…

1つのカテゴリー変数をグラフにする(ggplot2パッケージ)[R]

geom_bar( )を使って棒グラフを描く geom_bar( )の引数を指定する stat_count( )との対応 おわりに 参考資料 ggplot2パッケージ(tidyverseパッケージに含まれている)のdiamondsデータを使う。 > library(tidyverse) > head(diamonds) # A tibble: 6 x 10 c…

プロットマーカーや線の種類を変更する [R]

プロットマーカー 線 おわりに プロットマーカー マーカーの種類は引数pch*1(ggplot系ではshape)で数字を指定して変更できる。 ggpubrパッケージで凡例を表示できる。 library(ggpubr) show_point_shapes() 図1:マーカーの種類 中抜き:中は透明 0:四角 …

対象者背景表Table1作成(tableoneパッケージ)[R]

dput( )で変数名を書き出す 表示したい変数名を指定する カテゴリー変数として扱いたいものを指定する 表データを作成する 連続変数の詳細結果を表示する カテゴリー変数の詳細結果を表示する 体裁を整えて結果を表示する おわりに 参考資料 ここではsurviva…

Cox比例ハザードモデルを当てはめてadjusted survival curveを描く(ggplot系survminerパッケージ)[R]

パッケージとデータの準備 Coxモデルへ当てはめる ggadjustedcurves( )を使ってadjusted survival curveを描く 群間で患者背景を揃えた生存曲線 新規患者に期待される生存曲線 おわりに 参考資料 Cox比例ハザードモデル(Cox proportional hazard model, CPH…

Kaplan-Meier生存曲線をキレイに描く(ggplot系survminerパッケージ)[R]

ggsurvplot( )を使ってKaplan-Meier生存曲線を描く 信頼区間をつける 色パレットを変更する 線の種類を変更する 打ち切りマークを変更する 中央値を示す補助線をつける Risk tableをつける 軸について色々 軸の目盛り間隔を変更する 軸の単位を変更する 軸の…

ROC解析で識別能を評価する(pROCパッケージ, ggplot系ggroc関数)[R]

パッケージとデータの準備 ROC曲線下面積(AUC)を計算する ggroc( )を使ってROC曲線を描く パイプ演算子%>%を使うことも可能 2つのAUCを比較する おわりに 参考資料 検査を使って真の状態(例えばある疾患に罹患しているかどうか)や予後を予測する際に、そ…