ねこすたっと

ねこの気持ちと統計について悩む筆者の備忘録的ページ。

2022-01-01から1年間の記事一覧

回帰モデルの診断・評価(3):多重共線性

この記事では回帰モデルにおける「多重共線性」について学んでみるつもりです。回帰モデルの満たすべき仮定の概要については以下の記事を参考にしてください。 necostat.hatenablog.jp necostat.hatenablog.jp 多重共線性とは 多重共線性を疑う状況 分散拡大…

回帰モデルの診断・評価(2):線形性

この記事では回帰モデルが満たすべき前提条件のうち、「線形性」について評価する方法について学んでみるつもりです。回帰モデルの満たすべき仮定の概要については以下の記事を参考にしてください。 necostat.hatenablog.jp 線形性(linearity)の仮定とは C…

回帰モデルの診断・評価(1):正規性・等分散性・外れ値・独立性

Rothman先生のModern Epidemiology(4th edition)の拾い読みシリーズとして"Chapter 21:Regression Analysis Part II: Model Fitting and Assessment" をまとめようと思ったんですが、もう少し統計学寄りの内容を勉強しようと思い、Applied linear statist…

Rothman拾い読み:回帰モデルの選定

Rothman先生のModern Epidemiology(4th edition)をパラパラめくって拾い読みしたメモです。 今回は回帰についてということで、 "Chapter 20:Regression Analysis Part I: Model Specification"を参考にしています。 この記事では回帰モデルの選定(specif…

Rothman拾い読み:研究デザインの型

Rothman先生のModern Epidemiology(4th edition)をパラパラめくって拾い読みしたメモです。 今回は "Chapter 6:Epidemiologic Study Design With Validity and Efficiency Considerations" から、研究デザインの型について。 Chapter 6では研究デザインの…

Rothman拾い読み:交互作用と効果修飾

Rothman先生のModern Epidemiology(4th edition)をパラパラめくって拾い読みしたメモです。 今回は "Chapter 5:Measures of Effect and Measures of Association" , "Chapter 12:Confounding and the Interpretation of Interaction", "Chapter 26:Anal…

Rothman拾い読み:測定誤差と情報バイアス

Rothman先生のModern Epidemiology(4th edition)をパラパラめくって拾い読みしたメモです。 今回は "Chapter 13:Measurement and Measurement Error" から、測定誤差について。 測定誤差(measurement error)とは 測定における誤差の分類 測定誤差の影響…

Rothman拾い読み:選択バイアスと一般化可能性

Rothman先生のModern Epidemiology(4th edition)をパラパラめくって拾い読みしたメモです。 今回は "Chapter 5:Measures of Effect and Measures of Association" と "Chapter 14:Selection Bias and Generalizability" から、選択バイアスについて。 選…

Rothman拾い読み:交絡と交絡因子

Rothman先生のModern Epidemiology, 4th edition(以下ME)をパラパラめくって拾い読みしたメモです。 今回は "Chapter 5:Measures of Effect and Measures of Association" と "Chap 12:Confounding and Confounders" から、交絡について。 交絡(confoun…

Rothman拾い読み:効果・関連の指標

Rothman先生のModern Epidemiology, 4th edition(以下ME)をパラパラめくって拾い読みしたメモです。 今回は "Chapter 5:Measures of Effect and Measures of Association" から、効果・関連の指標について。 効果(effect) 因果効果(causal effect)と…

Rothman拾い読み:疾病の発生・存在を表す指標

Rothman先生のModern Epidemiology, 4th edition(以下ME)をパラパラめくって拾い読みしたメモです。 今回は "Chapter 4:Measures of Occurrence" から、疾病の発生や疾病状態の存在に関する指標について。 「発生の指標」と「存在の指標」 発生割合(inci…

Rothman拾い読み:“Population”にまつわるエトセトラ

Rothman先生のModern Epidemiology, 4th edition(以下ME)をパラパラめくって拾い読みしたメモです。 今回は "Chapter 4:Measures of Occurrence" から、population(集団)について。 疫学とは 集団(population) 閉じた集団(closed population)と開い…

Brunner-Munzel検定で分布によらずに2群の代表値を比較する(brunnermunzelパッケージ)[R]

パッケージとデータの準備 brunnermunzel.test( )を使ってBrunner-Munzel検定を行う brunnermunzel.permutation.test( )を使って並べ替えBrunner-Munzel検定を行う おわりに 参考資料 少し前に連続変数の代表値比較でどの検定方法を使えばよいのか考えた。 n…

Multivariate?Multivariable?多変量?多変数?

"Multivariate" と "Multivariable" 「多変量」と「多変数」 おわりに 参考資料 「1つの結果変数と2つ以上の説明変数を含んだ回帰分析」を何と呼ぶべきかについての備忘録。 "Multivariate" と "Multivariable" この問題については、以下のHidalgo氏とGoodma…

対応のない2群の代表値を比較するときに用いるべき検定方法

正規性の検定は必要? 等分散の検定は必要? サンプル数はどれくらい必要? おわりに 参考資料 「治療Aを受けた10人と治療Bを受けた10人で、1か月後の検査値Xがどちらが高いか?」というように、対応していない(同じ人でない)2群の連続変数の代表値(平均…

t分布とt検定を振り返る

T統計量とt分布 1標本のt検定(One-sample t test) 対応のあるt検定(paired t test) 対応のない2標本のt検定(Unpaired two-sample t test) おわりに 参考資料 T統計量とt分布 正規分布する母集団から標本 が得られたとき、つまり、 のとき、 が互いに独…

2×2表で関連性をみるための正確検定(Exactパッケージ)[R]

Fisher正確確率検定(Fisher's exact test) Fisher正確確率検定の問題点 固定されている周辺度数いろいろ 行も列も固定されているケース 行(あるいは列)のみ固定されているケース 合計数のみ固定されているケース Fisher正確確率検定の過剰な保守性に対処…

時間依存性共変量をスーパーランドマークモデルを使って解析する(dynpredパッケージ)[R]

ランドマーク(LM)解析とは スーパーランドマーク解析とは 必要なパッケージとデータの読み込み 使用するスーパーランドマーク解析の概要 cutLM( )を使ってLM解析用データセットを準備する。 おわりに 参考資料 ランドマーク(LM)解析とは Immortal time b…

RでTeX表記を使う(latex2expパッケージ)[R]

Tex( )でLaTeX表記を使う LaTeX表記の方法 おわりに 参考資料 文字や図版などの要素を紙面に配置するという作業を「組版」というが、TeXはこの作業を行うために開発された言語。 LaTeX(ラテフ, ラテク)はTeXを使いやすくした無料の文書処理システムで、数…

ZoteroとDropboxを使って文献管理(使い方編)

はじめに 文献を追加する PubMedやGoogle Scholarから追加する 手元のPDFを追加する 文献の情報を管理する 情報 メモ タグ 関連アイテム 文献を整理する 文献を引用する Citationの挿入・編集 Bibliographyの挿入・編集 引用スタイルの変更 更新ボタン 内蔵…

ZoteroとDropboxを使って文献管理(設定編)

はじめに Zoteroとは 準備するもの Zoteroアカウントを登録する Zoteroをインストールする ZotFileをダウンロードする Zoteroの設定をする 環境設定:一般 環境設定:同期 環境設定:引用 環境設定:詳細 表示 ZotFileの設定 Zotero connectorの設定 Safari…

反復処理でサブグループ解析を一括で行う(tidyverse系purrrパッケージ)[R]

サブグループ解析とは、全体からある特性を持った一部の集団(例:男性)を取り出して解析をすること。ランダム化が崩れたり、解析対象集団のサイズが小さくなるから検出力が落ちたり、多重検定の問題が生じたり、と色々注意はある。 でもこの記事では、そこ…

幾何平均(geometric mean)の信頼区間を求める(Gmean関数)[R]

はじめに 幾何平均の信頼区間 Gmean( )を使って計算する おわりに 参考資料 はじめに 平均と言えば大体は「算術平均(arithmetic mean, AM)」のこと。全部足して、要素の個数Nで割る。 これに対して、「幾何平均(geometric mean, GM)」は全部掛け合わせて…

ランドマーク解析を使ってimmortal time biasに対処する(dynpredパッケージ)[R]

Immortal time biasとは ランドマーク(LM)解析とは dynpredパッケージを使ってシンプルなLM解析を行う 必要なパッケージの読み込みと模擬データ作成 元データを通常どおり解析する cutLM( )を使ってランドマーク解析を行う cutLM( )を使わない場合 おわり…

文字列の操作(2):文字列を加工する(stringrパッケージ)[R]

文字列を変換する 文字列の一部分を置換する・除去する 大文字・小文字を変換する 新しい文字列を生成する 文字列を結合する 文字列を分割する 文字列を挿入する 文字列の長さを調整する おわりに 参考資料 stringrパッケージは文字列データの操作を楽にして…

文字列の操作(1):文字列を検出する・並べ替える(stringrパッケージ)[R]

パターンにマッチする文字列を検出する 指定パターンが含まれるかどうか判定する 指定パターンが含まれる位置を返す 文字列の一部分を抽出する 文字列を並べ替える おわりに 参考資料 stringrパッケージは文字列データの操作を楽にしてくれるパッケージ。 ti…

因子型データに対する操作(forcatsパッケージ)[R]

因子型データとは 因子型データの作り方 factor( )を作って因子型データを作る 2つの因子型データを統合する 因子型データの内容を確認する 水準の順序を変更する 他の変数に基づいて水準を並べ替える 水準の値を変更する fct_recode( )で水準のラベル名を変…

日付・時間の操作(2):期間を計算する(lubridateパッケージ)[R]

時間型データを丸める(切り上げ・切り捨て・四捨五入) 期間を計算する duration:時間の長さを秒単位に直して計算する period:人間の感覚の年月日で計算する interval:2つの時点の間隔を秒単位で計算する int_length( )を使ってintervalの長さを求める i…

日付・時間の操作(1):時間型データを作成する・要素を抽出する(lubridateパッケージ)[R]

時間型データの種類 ymd_hms( )を使って文字列から時間型データを作成する 時間帯(タイムゾーン) make_datetime( )を使って数値から時間型データを作成する 時間型データの各要素を抽出する 日付を曜日に変換する 半期・四半期に変換する 時間型データが条…

サンプルサイズ計算:1群の連続アウトカム(正規分布)の平均を既知の値と比較する [G*Power]

想定シナリオ 方法:t検定もとにして計算する おわりに 参考資料 自分用のリファレンスとして、サンプルサイズ計算に関する記事をシリーズで書いています。 なるべく体裁を統一するために、以下のように決めています。 群を示す添字について: c, C = 対照群…