ねこすたっと

ねこの気持ちと統計について悩む筆者の備忘録的ページ。

maths/theory

高校生のためのデータ分析入門 (24):離散型アウトカムの回帰モデル(後編)

数学が苦手なうちのJKに、将来必要となるかもしれないデータ分析への抵抗感をなくしてもらう目的で記事を書くことにしました。 前回:高校生のためのデータ分析入門 (23):離散型アウトカムの回帰モデル(前編) - ねこすたっと 平均値が大きくない個数・回…

高校生のためのデータ分析入門 (23):離散型アウトカムの回帰モデル(前編)

数学が苦手なうちのJKに、将来必要となるかもしれないデータ分析への抵抗感をなくしてもらう目的で記事を書くことにしました。 前回:高校生のためのデータ分析入門 (22):稀なイベントの回数ならポアソン分布! - ねこすたっと おさらい:線形回帰モデルで…

高校生のためのデータ分析入門 (22):稀なイベントの回数ならポアソン分布!

数学が苦手なうちのJKに、将来必要となるかもしれないデータ分析への抵抗感をなくしてもらう目的で記事を書くことにしました。 前回:高校生のためのデータ分析入門 (21):成功?失敗?それなら二項分布! - ねこすたっと 売店でたまにしか売れない商品、い…

高校生のためのデータ分析入門 (21):成功?失敗?それなら二項分布!

数学が苦手なうちのJKに、将来必要となるかもしれないデータ分析への抵抗感をなくしてもらう目的で記事を書くことにしました。 前回: 高校生のためのデータ分析入門 (20):期待値と分散・共分散の計算シャワー - ねこすたっと 残り試合でヒットは何本出そう…

高校生のためのデータ分析入門 (20):期待値と分散・共分散の計算シャワー

数学が苦手なうちのJKに、将来必要となるかもしれないデータ分析への抵抗感をなくしてもらう目的で記事を書くことにしました。 前回:高校生のためのデータ分析入門 (19):カテゴリー変数を説明変数に使う - ねこすたっと はじめに 期待値の計算 定数の期待…

高校生のためのデータ分析入門 (18):曲線を当てはめる

数学が苦手なうちのJKに、将来必要となるかもしれないデータ分析への抵抗感をなくしてもらう目的で記事を書くことにしました。 前回:高校生のためのデータ分析入門 (17):複数の説明変数を使った回帰モデル - ねこすたっと 曲線的な関係を当てはめる 線形回…

高校生のためのデータ分析入門 (17):複数の説明変数を使った回帰モデル

数学が苦手なうちのJKに、将来必要となるかもしれないデータ分析への抵抗感をなくしてもらう目的で記事を書くことにしました。 前回:高校生のためのデータ分析入門 (16):回帰モデルを当てはめてみよう - ねこすたっと モデルに複数の説明変数を含める 係数…

高校生のためのデータ分析入門 (16):回帰モデルを当てはめてみよう

数学が苦手なうちのJKに、将来必要となるかもしれないデータ分析への抵抗感をなくしてもらう目的で記事を書くことにしました。 回帰モデルは「期待値」と「誤差」でできている 例:気温を使って売り上げを予想する モデルを3つの数式で表してみる (1) Xによ…

高校生のためのデータ分析入門 (14):2つの変数の間には相関がある?

数学が苦手なうちのJKに、将来必要となるかもしれないデータ分析への抵抗感をなくしてもらう目的で記事を書くことにしました。 前回:高校生のためのデータ分析入門 (13):分散を計算しよう - ねこすたっと 相関ってなに? 相関係数ってなに? 相関係数が意…

高校生のためのデータ分析入門 (13):分散を計算しよう

数学が苦手なうちのJKに、将来必要となるかもしれないデータ分析への抵抗感をなくしてもらう目的で記事を書くことにしました。 前回:高校生のためのデータ分析入門 (12):期待値を計算しよう - ねこすたっと 分散とは? 分散を計算する nで割るか、n-1で割…

高校生のためのデータ分析入門 (12):期待値を計算しよう

数学が苦手なうちのJKに、将来必要となるかもしれないデータ分析への抵抗感をなくしてもらう目的で記事を書くことにしました。 前回:高校生のためのデータ分析入門 (11):比較の質を落とすもの - ねこすたっと 期待値とは? 離散変数の期待値 連続変数の期…

高校生のためのデータ分析入門 (7):サンプルから推定する(前編)

数学が苦手なうちのJKに、将来必要となるかもしれないデータ分析への抵抗感をなくしてもらう目的で記事を書くことにしました。 前回:高校生のためのデータ分析入門 (6):データ分析の大黒柱、正規分布 - ねこすたっと 全部調べるのは無理! 推定に誤差はつ…

高校生のためのデータ分析入門 (6):データ分析の大黒柱、正規分布

数学が苦手なうちのJKに、将来必要となるかもしれないデータ分析への抵抗感をなくしてもらう目的で記事を書くことにしました。 前回:高校生のためのデータ分析入門 (5):グラフにするのは超大事!(後編) - ねこすたっと そもそも確率分布ってなに? 確率…

分散分析(ANOVA):球面性仮定

分散分析で満たすべき仮定として球面性の仮定(the assumption of sphericity)*1をよく目にしますが、きちんと勉強したことがなかったので(わかるところだけ)読んでみました。 分散分析に必要な仮定 球面性の仮定とは 2水準間の差の分散に基づいた定義方…

分散分析(ANOVA):固定効果と変量効果

分散分析(Analysis of Variance, ANOVA)を学ぶ目的でKutner先生のApplied Linear Statistical Models(5th edition)を拾い読みし始めました。 前回は二元配置分散分析で分散分析表を作るところまで確認しました。。 necostat.hatenablog.jp 今回は要因の…

分散分析(ANOVA):二元配置分散分析

分散分析(Analysis of Variance, ANOVA)を学ぶ目的でKutner先生のApplied Linear Statistical Models(5th edition)を拾い読みし始めました。 前回は平方和と自由度の分割について、要因が1つの場合を使って確認しました。 necostat.hatenablog.jp 今回は…

分散分析(ANOVA):平方和と自由度の分割

分散分析(Analysis of Variance, ANOVA)を学ぶ目的でKutner先生のApplied Linear Statistical Models(5th edition)を拾い読みし始めました。今回は主に"Chapter 16: Single Factor Studies" から、分散分析の基本となる平方和・自由度の分割についてで…

回帰モデルの結果を限界効果(marginal effect)で示す

前回はロジスティック回帰モデルを(少しだけ)学び直してみました。 necostat.hatenablog.jp ここで扱ったNorton先生の文献では、オッズ比に代わるロジスティック回帰モデルの指標として限界効果(marginal effect)を推奨していましたので、簡単にどんなも…

ロジスティック回帰モデルを学び直す

分かったつもりで使っているけど、よくよく勉強し直したらあんまり分かってなかったことがよくあります。今回はロジスティック回帰モデル(ロジットモデル)について学び直してみました。 読んだ文献は、以下のものです(学び直しと言いながら1本だけです。…

回帰モデルの診断・評価(3):多重共線性

この記事では回帰モデルにおける「多重共線性」について学んでみるつもりです。回帰モデルの満たすべき仮定の概要については以下の記事を参考にしてください。 necostat.hatenablog.jp necostat.hatenablog.jp 多重共線性とは 多重共線性を疑う状況 分散拡大…

回帰モデルの診断・評価(2):線形性

この記事では回帰モデルが満たすべき前提条件のうち、「線形性」について評価する方法について学んでみるつもりです。回帰モデルの満たすべき仮定の概要については以下の記事を参考にしてください。 necostat.hatenablog.jp 線形性(linearity)の仮定とは C…

回帰モデルの診断・評価(1):正規性・等分散性・外れ値・独立性

Rothman先生のModern Epidemiology(4th edition)の拾い読みシリーズとして"Chapter 21:Regression Analysis Part II: Model Fitting and Assessment" をまとめようと思ったんですが、もう少し統計学寄りの内容を勉強しようと思い、Applied linear statist…

対応のない2群の代表値を比較するときに用いるべき検定方法

正規性の検定は必要? 等分散の検定は必要? サンプル数はどれくらい必要? おわりに 参考資料 「治療Aを受けた10人と治療Bを受けた10人で、1か月後の検査値Xがどちらが高いか?」というように、対応していない(同じ人でない)2群の連続変数の代表値(平均…

t分布とt検定を振り返る

T統計量とt分布 1標本のt検定(One-sample t test) 対応のあるt検定(paired t test) 対応のない2標本のt検定(Unpaired two-sample t test) おわりに 参考資料 T統計量とt分布 正規分布する母集団から標本 が得られたとき、つまり、 のとき、 が互いに独…

2×2表で関連性をみるための正確検定(Exactパッケージ)[R]

Fisher正確確率検定(Fisher's exact test) Fisher正確確率検定の問題点 固定されている周辺度数いろいろ 行も列も固定されているケース 行(あるいは列)のみ固定されているケース 合計数のみ固定されているケース Fisher正確確率検定の過剰な保守性に対処…

幾何平均(geometric mean)の信頼区間を求める(Gmean関数)[R]

はじめに 幾何平均の信頼区間 Gmean( )を使って計算する おわりに 参考資料 はじめに 平均と言えば大体は「算術平均(arithmetic mean, AM)」のこと。全部足して、要素の個数Nで割る。 これに対して、「幾何平均(geometric mean, GM)」は全部掛け合わせて…

サンプルサイズ計算:1群の連続アウトカム(正規分布)の平均を既知の値と比較する [R]

想定シナリオ 方法0:手計算 方法1:pwr.t.test( )を使って計算する 方法2:TwoSampleMean.Equality( )を使って計算する 方法3:power.prop.test( )を使って計算する おわりに 参考資料 自分用のリファレンスとして、サンプルサイズ計算に関する記事をシリー…

サンプルサイズ計算:2群の連続アウトカム(正規分布)を比較する [R]

想定シナリオ 方法0:手計算 方法1:pwr.t.test( )を使って計算する 方法2:TwoSampleMean.Equality( )を使って計算する 方法3:power.prop.test( )を使って計算する おわりに 参考資料 自分用のリファレンスとして、サンプルサイズ計算に関する記事をシリー…

サンプルサイズ計算:1群の2値アウトカムの割合から母集団における割合を推定する [R]

想定シナリオ 方法0:手計算 方法1:pwr.p.test( )を使って計算する おわりに 参考資料 自分用のリファレンスとして、サンプルサイズ計算に関する記事をシリーズで書いています。 なるべく体裁を統一するために、以下のように決めています。 群を示す添字に…

サンプルサイズ計算:2群の2値アウトカムを比較する(オッズ比) [R]

想定シナリオ 方法0:手計算 方法1:RelativeRisk.Equality( )を使って計算する おわりに 参考資料 自分用のリファレンスとして、サンプルサイズ計算に関する記事をシリーズで書いています。 なるべく体裁を統一するために、以下のように決めています。 群を…