ねこすたっと

ねこの気持ちと統計について悩む筆者の備忘録的ページ。

ggplot

空間データを可視化する(2)(sfパッケージ) [R]

はじめに GISデータをプロットしてみる 例1:plot( )を使う 例2:geom_sf( )を使う 例3:離散変数に従って塗り分ける 例4:連続変数に従って塗り分ける 例5:複数の図を重ねる おわりに 参考資料 はじめに Rのsfパッケージを使って、神戸市の校区境界と学校…

空間データを可視化する(1)(sfパッケージ) [R]

はじめに GISデータを準備する データファイルの概要 データの読み込みと確認 データの一部を抽出する 属性データを付け加える おわりに 参考資料 はじめに 例えば、人口密度などの特性によって都道府県を塗り分けた図や、医療機関の位置を地図上にプロット…

geom_contour関数で等高線を描く(ggplot2パッケージ)[R]

先日、ある変数の2次元分布をヒートマップを使って可視化する方法をまとめました。 necostat.hatenablog.jp ヒートマップで変数の区切りを細かくしていくと、滑らかなグラデーションにすることができます。 見た目が綺麗になるのはいいんですが、色の差がわ…

geom_tileを使って予測確率をヒートマップで表現する(ggplot2パッケージ)[R]

ロジスティック回帰モデルなどから予測されるアウトカム発生確率(=予測確率)をグラフで可視化したいとします。 1つの変数に対して予測確率がどのように変化していくかを示したければ、折れ線グラフにしたり、変数をカテゴリー化して棒グラフで表したりする…

RでTeX表記を使う(latex2expパッケージ)[R]

Tex( )でLaTeX表記を使う LaTeX表記の方法 おわりに 参考資料 文字や図版などの要素を紙面に配置するという作業を「組版」というが、TeXはこの作業を行うために開発された言語。 LaTeX(ラテフ, ラテク)はTeXを使いやすくした無料の文書処理システムで、数…

Kaplan-Meier生存曲線をキレイに描く(ggplot系jskmパッケージ)[R]

jskm( )を使ってKaplan-Meier生存曲線を描く 信頼区間をつける 色パレットを変更する 線の種類を変更する 打ち切りマークを変更する Risk tableをつける 軸について色々 軸の目盛り間隔を変更する 軸の範囲・ラベルを指定する 検定結果を表示する 凡例を変更…

カラーパレットで色を指定する(RColorBrewer, viridis, ggsciパッケージ)[R]

グレースケールで描く RColorBrewerパッケージ viridisパッケージ ggsciパッケージ Nature Publishing Groups The New England Journal of Medicine (NEJM) Lancet The Journal of the American Medical Association (JAMA) Journal of Clinical Oncology 色…

時系列データをグラフにする(ggplot2パッケージ)[R]

時間・順序と組になっている変量をグラフにする geom_area( )で面グラフを描く geom_line( )で折れ線グラフを描く geom_ribbon( )でリボンプロットを描く geom_step( )で階段状プロットを描く geom_path( )で経路を表示する おわりに 参考資料 時間・順序と…

1つの連続変数と1つのカテゴリー変数をグラフにする(ggplot2パッケージ)[R]

geom_boxplot( )を使って箱ヒゲ図を描く 箱の形状に関する指定 箱の色・線種に関する指定 外れ値に関する指定 geom_violin( )でバイオリンプロットを描く stat_*( )との対応 おわりに 参考資料 ggplot2パッケージ(tidyverseパッケージに含まれている)のdia…

2つの連続変数をグラフにする(ggplot2パッケージ)[R]

geom_point( )で散布図を描く geom_smooth( )で回帰直線・曲線を描く geom_rug( )で周辺ラグプロットを描く おわりに 参考資料 ggplot2パッケージ(tidyverseパッケージに含まれている)のdiamondsデータを使う。 > library(tidyverse) > head(diamonds) # A…

2つのカテゴリー変数をグラフにする(ggplot2パッケージ)[R]

geom_jitter( )で点をずらして描く geom_count( )で各カテゴリーの合計数をプロットする stat_sum( )との対応 おわりに 参考資料 ggplot2パッケージ(tidyverseパッケージに含まれている)のdiamondsデータを使う。 > library(tidyverse) > head(diamonds) #…

1つの連続変数をグラフにする(ggplot2パッケージ)[R]

geom_histogram( )を使ってヒストグラムを描く geom_area( )を使って面グラフを描く geom_freqplot( )を使って折れ線グラフを描く geom_density( )を使って密度プロットを描く stat_bin( )との対応しているgeom_*関数 おわりに 参考資料 ggplot2パッケージ(…

1つのカテゴリー変数をグラフにする(ggplot2パッケージ)[R]

geom_bar( )を使って棒グラフを描く geom_bar( )の引数を指定する stat_count( )との対応 おわりに 参考資料 ggplot2パッケージ(tidyverseパッケージに含まれている)のdiamondsデータを使う。 > library(tidyverse) > head(diamonds) # A tibble: 6 x 10 c…

Cox比例ハザードモデルを当てはめてadjusted survival curveを描く(ggplot系survminerパッケージ)[R]

パッケージとデータの準備 Coxモデルへ当てはめる ggadjustedcurves( )を使ってadjusted survival curveを描く 群間で患者背景を揃えた生存曲線 新規患者に期待される生存曲線 おわりに 参考資料 Cox比例ハザードモデル(Cox proportional hazard model, CPH…

Kaplan-Meier生存曲線をキレイに描く(ggplot系survminerパッケージ)[R]

ggsurvplot( )を使ってKaplan-Meier生存曲線を描く 信頼区間をつける 色パレットを変更する 線の種類を変更する 打ち切りマークを変更する 中央値を示す補助線をつける Risk tableをつける 軸について色々 軸の目盛り間隔を変更する 軸の単位を変更する 軸の…

ROC解析で識別能を評価する(pROCパッケージ, ggplot系ggroc関数)[R]

パッケージとデータの準備 ROC曲線下面積(AUC)を計算する ggroc( )を使ってROC曲線を描く パイプ演算子%>%を使うことも可能 2つのAUCを比較する おわりに 参考資料 検査を使って真の状態(例えばある疾患に罹患しているかどうか)や予後を予測する際に、そ…

Bland-Altmanプロットで測定の一致性を評価する(BlandAltmanLehパッケージ)[R]

Agreementの評価として相関係数を用いることは誤り 正しくはBland-Altmanプロットを用いる BlandAltmanLehパッケージでB-Aプロットを描く 基本関数のplot( )を使って描く ggplot系を使って描くこともできる タイがあるとき 必要な値を抽出する おわりに 参考…