ねこすたっと

ねこの気持ちと統計について悩む筆者の備忘録的ページ。

「割合」や「率」に対してオフセット項付きポアソン回帰モデルを当てはめる [R]

アウトカムが「割合」、というか「試行数と成功数」として与えられているときに二項回帰モデルを当てはめる方法は以前まとめました。 今回は「オフセット項」を使った回帰モデルに当てはめる方法をまとめてみようと思います。 オフセット項(offset)とは 使…

試行数と成功数が与えられたデータに対して二項回帰モデルを当てはめる [R]

アウトカムが2値変数のときに使う回帰モデルについては、以前まとめたことがあります。 necostat.hatenablog.jp 今回はアウトカムが「割合」、というか「試行数と成功数」として与えられているときの回帰モデルについてまとめてみます。 使用するデータ cbin…

Hoyle拾い読み:検証的因子分析(CFA)

構造方程式モデリング(Structural Equation Modeling, SEM)の初学者が、 タイトルの "Handbook" に誘われて買ってしまったHoyle先生の分厚い本を拾い読みしたメモです。 といっても、私にとって重すぎる内容は拾い上げられていません。 今回は "Chapter 22…

Hoyle拾い読み:SEMにおけるモデル設定と識別条件

構造方程式モデリング(Structural Equation Modeling, SEM)の初学者が、 タイトルの "Handbook" に誘われて買ってしまったHoyle先生の分厚い本を拾い読みしたメモです。 といっても、私にとって重すぎる内容は拾い上げられていません。 今回は "Chapter 8…

Hoyle拾い読み:SEMのパス図と構成要素

構造方程式モデリング(Structural Equation Modeling, SEM)の初学者が、 タイトルの "Handbook" に誘われて買ってしまったHoyle先生の分厚い本を拾い読みしたメモです。 といっても、私にとって重すぎる内容は拾い上げられていません。 今回は "Chapter 3…

Hoyle拾い読み:構造方程式モデリング(SEM)とは

構造方程式モデリング(Structural Equation Modeling, SEM)の初学者が、 タイトルの "Handbook" に誘われて買ってしまったHoyle先生の分厚い本を拾い読みしたメモです。 といっても、私にとって重すぎる内容は拾い上げられていません。 まずは "Chapter 1…

多重比較補正に対する考え方 [R]

測定されたデータをもとにして母集団を比較するときには2種類の誤りが生じる可能性があります。 第1種過誤(αエラー):本当は差がないのに「差がある」と判断してしまう誤り 第2種過誤(βエラー):本当は差があるのに「差がない」と判断してしまう誤り エ…

回帰モデルの診断・評価(3):多重共線性

この記事では回帰モデルにおける「多重共線性」について学んでみるつもりです。回帰モデルの満たすべき仮定の概要については以下の記事を参考にしてください。 necostat.hatenablog.jp necostat.hatenablog.jp 多重共線性とは 多重共線性を疑う状況 分散拡大…

回帰モデルの診断・評価(2):線形性

この記事では回帰モデルが満たすべき前提条件のうち、「線形性」について評価する方法について学んでみるつもりです。回帰モデルの満たすべき仮定の概要については以下の記事を参考にしてください。 necostat.hatenablog.jp 線形性(linearity)の仮定とは C…

回帰モデルの診断・評価(1):正規性・等分散性・外れ値・独立性

Rothman先生のModern Epidemiology(4th edition)の拾い読みシリーズとして"Chapter 21:Regression Analysis Part II: Model Fitting and Assessment" をまとめようと思ったんですが、もう少し統計学寄りの内容を勉強しようと思い、Applied linear statist…

Rothman拾い読み:回帰モデルの選定

Rothman先生のModern Epidemiology(4th edition)をパラパラめくって拾い読みしたメモです。 今回は回帰についてということで、 "Chapter 20:Regression Analysis Part I: Model Specification"を参考にしています。 この記事では回帰モデルの選定(specif…

Rothman拾い読み:研究デザインの型

Rothman先生のModern Epidemiology(4th edition)をパラパラめくって拾い読みしたメモです。 今回は "Chapter 6:Epidemiologic Study Design With Validity and Efficiency Considerations" から、研究デザインの型について。 Chapter 6では研究デザインの…

Rothman拾い読み:交互作用と効果修飾

Rothman先生のModern Epidemiology(4th edition)をパラパラめくって拾い読みしたメモです。 今回は "Chapter 5:Measures of Effect and Measures of Association" , "Chapter 12:Confounding and the Interpretation of Interaction", "Chapter 26:Anal…

Rothman拾い読み:測定誤差と情報バイアス

Rothman先生のModern Epidemiology(4th edition)をパラパラめくって拾い読みしたメモです。 今回は "Chapter 13:Measurement and Measurement Error" から、測定誤差について。 測定誤差(measurement error)とは 測定における誤差の分類 測定誤差の影響…

Rothman拾い読み:選択バイアスと一般化可能性

Rothman先生のModern Epidemiology(4th edition)をパラパラめくって拾い読みしたメモです。 今回は "Chapter 5:Measures of Effect and Measures of Association" と "Chapter 14:Selection Bias and Generalizability" から、選択バイアスについて。 選…

Rothman拾い読み:交絡と交絡因子

Rothman先生のModern Epidemiology, 4th edition(以下ME)をパラパラめくって拾い読みしたメモです。 今回は "Chapter 5:Measures of Effect and Measures of Association" と "Chap 12:Confounding and Confounders" から、交絡について。 交絡(confoun…

Rothman拾い読み:効果・関連の指標

Rothman先生のModern Epidemiology, 4th edition(以下ME)をパラパラめくって拾い読みしたメモです。 今回は "Chapter 5:Measures of Effect and Measures of Association" から、効果・関連の指標について。 効果(effect) 因果効果(causal effect)と…

Rothman拾い読み:疾病の発生・存在を表す指標

Rothman先生のModern Epidemiology, 4th edition(以下ME)をパラパラめくって拾い読みしたメモです。 今回は "Chapter 4:Measures of Occurrence" から、疾病の発生や疾病状態の存在に関する指標について。 「発生の指標」と「存在の指標」 発生割合(inci…

Rothman拾い読み:“Population”にまつわるエトセトラ

Rothman先生のModern Epidemiology, 4th edition(以下ME)をパラパラめくって拾い読みしたメモです。 今回は "Chapter 4:Measures of Occurrence" から、population(集団)について。 疫学とは 集団(population) 閉じた集団(closed population)と開い…

Brunner-Munzel検定で分布によらずに2群の代表値を比較する(brunnermunzelパッケージ)[R]

パッケージとデータの準備 brunnermunzel.test( )を使ってBrunner-Munzel検定を行う brunnermunzel.permutation.test( )を使って並べ替えBrunner-Munzel検定を行う おわりに 参考資料 少し前に連続変数の代表値比較でどの検定方法を使えばよいのか考えた。 n…

Multivariate?Multivariable?多変量?多変数?

"Multivariate" と "Multivariable" 「多変量」と「多変数」 おわりに 参考資料 「1つの結果変数と2つ以上の説明変数を含んだ回帰分析」を何と呼ぶべきかについての備忘録。 "Multivariate" と "Multivariable" この問題については、以下のHidalgo氏とGoodma…

対応のない2群の代表値を比較するときに用いるべき検定方法

正規性の検定は必要? 等分散の検定は必要? サンプル数はどれくらい必要? おわりに 参考資料 「治療Aを受けた10人と治療Bを受けた10人で、1か月後の検査値Xがどちらが高いか?」というように、対応していない(同じ人でない)2群の連続変数の代表値(平均…

t分布とt検定を振り返る

T統計量とt分布 1標本のt検定(One-sample t test) 対応のあるt検定(paired t test) 対応のない2標本のt検定(Unpaired two-sample t test) おわりに 参考資料 T統計量とt分布 正規分布する母集団から標本 が得られたとき、つまり、 のとき、 が互いに独…

2×2表で関連性をみるための正確検定(Exactパッケージ)[R]

Fisher正確確率検定(Fisher's exact test) Fisher正確確率検定の問題点 固定されている周辺度数いろいろ 行も列も固定されているケース 行(あるいは列)のみ固定されているケース 合計数のみ固定されているケース Fisher正確確率検定の過剰な保守性に対処…

時間依存性共変量をスーパーランドマークモデルを使って解析する(dynpredパッケージ)[R]

ランドマーク(LM)解析とは スーパーランドマーク解析とは 必要なパッケージとデータの読み込み 使用するスーパーランドマーク解析の概要 cutLM( )を使ってLM解析用データセットを準備する。 おわりに 参考資料 ランドマーク(LM)解析とは Immortal time b…

RでTeX表記を使う(latex2expパッケージ)[R]

Tex( )でLaTeX表記を使う LaTeX表記の方法 おわりに 参考資料 文字や図版などの要素を紙面に配置するという作業を「組版」というが、TeXはこの作業を行うために開発された言語。 LaTeX(ラテフ, ラテク)はTeXを使いやすくした無料の文書処理システムで、数…

ZoteroとDropboxを使って文献管理(使い方編)

はじめに 文献を追加する PubMedやGoogle Scholarから追加する 手元のPDFを追加する 文献の情報を管理する 情報 メモ タグ 関連アイテム 文献を整理する 文献を引用する Citationの挿入・編集 Bibliographyの挿入・編集 引用スタイルの変更 更新ボタン 内蔵…

ZoteroとDropboxを使って文献管理(設定編)

はじめに Zoteroとは 準備するもの Zoteroアカウントを登録する Zoteroをインストールする ZotFileをダウンロードする Zoteroの設定をする 環境設定:一般 環境設定:同期 環境設定:引用 環境設定:詳細 表示 ZotFileの設定 Zotero connectorの設定 Safari…

反復処理でサブグループ解析を一括で行う(tidyverse系purrrパッケージ)[R]

サブグループ解析とは、全体からある特性を持った一部の集団(例:男性)を取り出して解析をすること。ランダム化が崩れたり、解析対象集団のサイズが小さくなるから検出力が落ちたり、多重検定の問題が生じたり、と色々注意はある。 でもこの記事では、そこ…

幾何平均(geometric mean)の信頼区間を求める(Gmean関数)[R]

はじめに 幾何平均の信頼区間 Gmean( )を使って計算する おわりに 参考資料 はじめに 平均と言えば大体は「算術平均(arithmetic mean, AM)」のこと。全部足して、要素の個数Nで割る。 これに対して、「幾何平均(geometric mean, GM)」は全部掛け合わせて…