分割時系列解析（Interrupted Time Series Analysis）による公衆衛生介入の評価 [R]

quasi-experiment R neco

ITSAとは ITSデザインに適した状況は？インパクトモデルを選ぶ分析実行例使用するデータ散布図を描く Level Change Model Slope Change Model Level + Slope Change Model 自己相関を確認するおわりに参考文献 ITSAとは例えば新しい政策が実施される…

2025-02-12

Joint Frailty-Copula Modelを使った生存時間解析 (2)：実践編（joint.Coxパッケージ） [R]

survival clustered/repeated R 統計 neco

前回、「Joint Frailty-Copula Modelを使った生存時間解析」の理論的なことについてまとめました。 necostat.hatenablog.jp 読んだ本： Survival Analysis with Correlated Endpoints: Joint Frailty-Copula Models (JSS Research Series in Statistics)作者…

2024-08-21

カッパ係数でカテゴリー変数の一致度をみる [R]

measurement R neco

カッパ係数（Cohen's kappa statistic）とは定義解釈重み付けカッパ係数（weighted kappa statistic）定義 Rで計算してみるサンプルデータを作成する方法1：irrパッケージを用いる方法2：vcdパッケージを用いる方法3：psychパッケージを用いるおわ…

2024-05-02

空間データを可視化する(2)（sfパッケージ） [R]

R spatial ggplot neco

はじめに GISデータをプロットしてみる例1：plot( )を使う例2：geom_sf( )を使う例3：離散変数に従って塗り分ける例4：連続変数に従って塗り分ける例5：複数の図を重ねるおわりに参考資料はじめに Rのsfパッケージを使って、神戸市の校区境界と学校…

2024-05-02

空間データを可視化する(1)（sfパッケージ） [R]

R spatial ggplot

はじめに GISデータを準備するデータファイルの概要データの読み込みと確認データの一部を抽出する属性データを付け加えるおわりに参考資料はじめに例えば、人口密度などの特性によって都道府県を塗り分けた図や、医療機関の位置を地図上にプロット…

2024-02-14

高校生のためのデータ分析入門 (30)：解析環境を準備しよう！

elementary R Python

数学が苦手なうちのJKに、将来必要となるかもしれないデータ分析への抵抗感をなくしてもらう目的で記事を書いてきました。30回目の今回で一区切り、シーズン終了（修了）です。前回に引き続き、最終回も実際にデータを分析する準備をしていきましょう。クラ…

#高校生のための #統計学 #データ分析

2023-08-02

lapply関数とdo.call関数を整理する [R]

R iteration

do.call( )は関数名と引数のリストを渡して、その関数を呼び出して実行する関数です。リストに対して一括処理をするとき、たまに登場するんですがイマイチ理解していなかったので整理のためにまとめます。 lapply( )とdo.call( )の違い関数のオプション引…

2023-08-01

ラムダ式を使って関数を定義する [R]

R

同じ操作を反復するときは、map( )やlapply( )を使って関数を一括して適用すると便利です。そしてコードも読みやすくなります。 map( )やlapply( )では、関数を引数にする必要があります。mean( )やsd( )のように、既に与えられている関数だけでなく、自分で…

2023-07-30

geom_contour関数で等高線を描く（ggplot2パッケージ）[R]

ggplot R

先日、ある変数の2次元分布をヒートマップを使って可視化する方法をまとめました。 necostat.hatenablog.jp ヒートマップで変数の区切りを細かくしていくと、滑らかなグラデーションにすることができます。見た目が綺麗になるのはいいんですが、色の差がわ…

2023-07-30

rowwise関数を使って複数の列を組み合わせた変数を作成する（tidyverseパッケージ）[R]

tidyverse data handling R neco

臨床現場では、対象者の年齢や症状、検査値などをもとにして計算される「何とかスコア」が使われることがよくあると思います。臨床研究でも、既に収集された項目からcomposite scoreを計算し、変数に追加したいことはよくあります。今回はtidyverseパッケ…

2023-07-30

across関数を使ってデータフレームの列に対して一括で操作する（tidyverseパッケージ）[R]

tidyverse data handling R neco

以前、データフレームの列（=変数）に対して、追加・名前変更・要約などの操作方法についてまとめました。 necostat.hatenablog.jp necostat.hatenablog.jp 最近は列の操作でacross関数を使うことが多くなってきたので、ここらへんで学び直しておこうと思い…

2023-07-29

geom_tileを使って予測確率をヒートマップで表現する（ggplot2パッケージ）[R]

ggplot prediction/diagnostic R neco

ロジスティック回帰モデルなどから予測されるアウトカム発生確率（=予測確率）をグラフで可視化したいとします。 1つの変数に対して予測確率がどのように変化していくかを示したければ、折れ線グラフにしたり、変数をカテゴリー化して棒グラフで表したりする…

2023-03-28

混合効果モデルで変化点を探す：Stanを使ったベイズ統計モデリング [R]

Bayes/Stan clustered/repeated R neco

以前、segmentedパッケージを使って変化点を探す方法を調べました。 necostat.hatenablog.jp segment( )はglmオブジェクト（=glm関数で当てはめたモデル）とlmeオブジェクト（=変量効果を含む線形回帰モデル）には対応しているんですが、lme( )は変量効果を…

2023-03-26

Segmented modelを使って変化点を探す（segmentedパッケージ）[R]

piece-wise R

ある点を境にしてアウトカムの変化が急激になっているように見えて、「変化点はどこなのか」あるいはそもそも「変化点があると言えるのか」を知りたいときがあると思います。僕もそういうときがあったので少し調べてみました。使用するパッケージとデータ…

2023-03-24

「割合」や「率」に対してオフセット項付きポアソン回帰モデルを当てはめる [R]

dichotomous R neco

アウトカムが「割合」、というか「試行数と成功数」として与えられているときに二項回帰モデルを当てはめる方法は以前まとめました。今回は「オフセット項」を使った回帰モデルに当てはめる方法をまとめてみようと思います。オフセット項（offset）とは使…

2023-03-22

試行数と成功数が与えられたデータに対して二項回帰モデルを当てはめる [R]

dichotomous R

アウトカムが2値変数のときに使う回帰モデルについては、以前まとめたことがあります。 necostat.hatenablog.jp 今回はアウトカムが「割合」、というか「試行数と成功数」として与えられているときの回帰モデルについてまとめてみます。使用するデータ cbin…

2023-01-06

多重比較補正に対する考え方 [R]

testing R neco

測定されたデータをもとにして母集団を比較するときには2種類の誤りが生じる可能性があります。第1種過誤（αエラー）：本当は差がないのに「差がある」と判断してしまう誤り第2種過誤（βエラー）：本当は差があるのに「差がない」と判断してしまう誤りエ…

2022-12-30

回帰モデルの診断・評価(3)：多重共線性

maths/theory validation variable selection R

この記事では回帰モデルにおける「多重共線性」について学んでみるつもりです。回帰モデルの満たすべき仮定の概要については以下の記事を参考にしてください。 necostat.hatenablog.jp necostat.hatenablog.jp 多重共線性とは多重共線性を疑う状況分散拡大…

2022-12-30

回帰モデルの診断・評価(2)：線形性

maths/theory validation R neco

この記事では回帰モデルが満たすべき前提条件のうち、「線形性」について評価する方法について学んでみるつもりです。回帰モデルの満たすべき仮定の概要については以下の記事を参考にしてください。 necostat.hatenablog.jp 線形性（linearity）の仮定とは C…

2022-12-28

回帰モデルの診断・評価(1)：正規性・等分散性・外れ値・独立性

maths/theory validation R neco

Rothman先生のModern Epidemiology（4th edition）の拾い読みシリーズとして"Chapter 21：Regression Analysis Part II: Model Fitting and Assessment" をまとめようと思ったんですが、もう少し統計学寄りの内容を勉強しようと思い、Applied linear statist…

2022-11-01

Brunner-Munzel検定で分布によらずに2群の代表値を比較する（brunnermunzelパッケージ）[R]

testing R

パッケージとデータの準備 brunnermunzel.test( )を使ってBrunner-Munzel検定を行う brunnermunzel.permutation.test( )を使って並べ替えBrunner-Munzel検定を行うおわりに参考資料少し前に連続変数の代表値比較でどの検定方法を使えばよいのか考えた。 n…