分散分析（ANOVA）：球面性仮定

分散分析で満たすべき仮定として球面性の仮定（the assumption of sphericity）*1をよく目にしますが、きちんと勉強したことがなかったので（わかるところだけ）読んでみました。

分散分析に必要な仮定
球面性の仮定とは
- 2水準間の差の分散に基づいた定義方法
- 直交対比の分散・共分散に基づいた定義方法
検定方法
球面性仮定が満たされなかったときの補正方法
おわりに
参考資料

分散分析に必要な仮定

異なる対象者同士で比較する被験者間分散分析（between-subjects ANOVA）には、

観測が互いに独立である（independence of observations）
各群内で正規分布している（normality）
各群の分散が等しい（homogeneity of variance）

の3つの仮定が必要です。

同じ対象者に対して観察された値同士を比較する 被験者内分散分析（within-subjects ANOVA） 、あるいは反復測定分散分析（repeated measures ANOVA） では、上記に加え 球面性の仮定（the assumption of sphericity） が必要になります。

球面性の仮定は反復測定ANOVAにおいてF値が正確なF分布に従うための必要十分条件で、これが満たされていないと第1種過誤が増加してしまい*2、ANOVAの結果が不適切になってしまいます。

球面性の仮定とは

Lane (2016) の導入で、球面性について2通りの定義を紹介していました。

2水準間の差の分散に基づいた定義方法
直交対比（orthogonal contrast）の分散・共分散に基づいた定義方法

両者は同値ですが、前者の方が説明が分かりやすく、後者の方が一般化して複雑なデザインにも対応できます。

2水準間の差の分散に基づいた定義方法

要因に含まれる全ての2水準間について対象者内の差を計算し、その分散が全て等しいとき、球面性が満たされていると定義します。下の表では、T1〜T3の3つの水準の差（T3-T2, T3-T1, T2-T1）を計算して、その分散が全て等しい値（=8）になっていることを示しています。ちなみに分散分析では各群の分散が等しくなければいけないので、T1〜T3の分散も全て等しい値（=10）になっていることを示しています。

]

水準が2つしかない場合（例えば前値・後値を測定）、水準間差は1つしか存在しないので、「水準間によって分散が異なっている」という事態は発生せず球面性は常に成り立ちます。

直交対比の分散・共分散に基づいた定義方法

多重比較の手順の1つであるSchefféの方法で対比（contrast）が登場します。複数の平均値（例えば $\mu_1, \mu_2, \mu_3, \mu_4$ ）を比べるとき、任意の平均の比較は $\mu_1, \mu_2, \mu_3, \mu_4$ の線型結合が0であるという形式で表すことができます。

例えば「1番目と2番目の平均が等しい」、つまり $\mu_1 = \mu_2$ という仮説は、

$1 \times \mu_1 + (-1) \times \mu_2 + 0 \times \mu_3 + 0 \times \mu_4 = 0$

と書けますし、「1番目の平均と他の3つの平均の平均が等しい」、つまり $\mu_1 = \frac{\mu_2 + \mu_3 + \mu_4}{3}$ という仮説は、

$1 \times \mu_1 + \left( -\frac{1}{3} \right) \times \mu_2 + \left( -\frac{1}{3} \right) \times \mu_3 + \left( -\frac{1}{3} \right) \times \mu_4 = 0$

と書けます。

この線型結合の係数を 対比（contrast） といいます（各係数を要素に持つベクトルです）。

2つの対比が直交する（=内積が0）とき、この2つの対比は直交対比（orthogonal contrast）であると言います。分散分析の帰無仮説である「p個の平均が全て等しい」、つまり $\mu_1 = \mu_2 = ... = \mu_p$ という仮説は、「p-1個の直交対比が全て0である」という仮説に置き換えることができます（p-1個の直交対比の選び方は無数にありますが、互いに直交する対比は常にp-1個しか作れません）。

このp-1個の直交対比ベクトル（←各々がp個の要素からなる）を並べた(p-1)×p行列を直交対比行列（orthogonal matrix）と言います。さらに、

各行の和 = 0
各行の長さ（平方和）= 1

という条件が追加されたものを正規直交対比行列（orthonormal contrast matrix）と言います。

元のデータの共分散行列 $\Sigma$ を正規直交対比行列 $C$ を使って、 $C \Sigma C^{T}$ と変換したものが、対角成分が全て等しい対角行列 $\lambda I$ になっているというのが球面性の仮定です。

$C \Sigma C^{T} = \lambda I$

$\Sigma = E(X^{T} X)$ を鑑みてさらに読み砕くと、

元データXを正規直交対比行列で変換した $X C^{T}$ の分散が等しく、かつ互いに相関がない というのが球面性の仮定の意味するところです。

直交対比に基づいた球面性の仮定については、名古屋大学大学院教育発達科学研究科心理発達科学専攻計量心理学領域石井研究室が公開している資料集を参考にしました。非常に分かりやすい資料でとても勉強になりましした。

検定方法

Mauchly（モクリー）の球面性検定がよく知られています。Mauchlyの統計量Wは0（球面性が成り立たない）〜1（完全に球面性OK）の値を取り、仮説が棄却された（P値が小さい）場合は球面性が成り立っていないと判断します。

もし被験者内要因（=反復測定要因）に加えて、被験者間要因を含むデザインでは、共分散行列が群ごとで等質かどうかを検証しなくてはなりません。Mauchly検定はこれに対応していません。球面性と共分散の等質性を一度に検定する方法としてMendozaの多標本球面性検定があります。

これについては井関先生が詳しく解説されています（井関先生が作成されたR関数ANOVA君ではMendoza検定がデフォルトになっているとのこと）。

riseki.php.xdomain.jp

球面性仮定が満たされなかったときの補正方法

球面性仮定が満たされていない場合、計算されたF値がF分布に従うとみなせなくなるので調整が必要です。ε統計量を使って分散分析の自由度を調整します。

データから計算されたF値をF(df1, df2)分布に当てはめてP値を計算するのではなく、F(ε×df1, ε×df2)分布に当てはめて計算します。当てはめるF分布の自由度が小さいほど計算されるP値は大きくなります。

ε統計量の計算方法はいくつかあります。いずれも0〜1の範囲で求められ、球面性が成り立っていないときほど0に近い値になるので、自由度は調整前よりも小さくなり、P値は調整前よりも大きくなります。

下限値：εの取りうる理論的下限値です。1/(水準数-1)で計算できるのでPC不要ですが、保守的過ぎるので通常使いません。
Greenhouse-Geisser法*3：ε≧0.75のときには厳し過ぎるとのこと
Huynh-Feldt法*4：計算上1を超えることがありますが、その場合は1を用います。Lecoutre（ルクルト）による修正版が用いられていることが多く、Huynh-Feldt-Lecoutre法と呼ぶ方が良いかもしれません。
Chi-Muller法：計算上1を超えることも、下限値よりも小さい値になることもあるとのこと。GG法、HFL法の使い分けを気にせず、広い状況で優れている？

使い分けの詳細はまだ勉強しきれていません。ひとまずは

ε<0.75 → Greenhouse-Geisser法
ε≧0.75 → Huynh-Feldt-Lecoutre法

とざっくり覚えておきたいと思います。

おわりに

理解という意味ではまだまだですが、出力された表に何が書いてあるかは分かるようになりました。
猫の爪研ぎタワーから毎日大量のゴミが出ます。麻紐がとれて芯が剥き出しです。

ランキング参加中

統計

参考資料

Lane, D. M. (2016). The assumption of sphericity in repeated-measures designs: what it means and what to do when it is violated. The Quantitative Methods for Psychology, 12(2), 114–122. doi:10.20982/tqmp.12.2.p114
千野直仁. 行動研究における反復測定デザインANOVAの誤用 - I. 愛知学院大学心身科学部紀要第9号（45-52）(2013).
EZR, SPSSでの実行方法なども紹介されています。

toukeier.hatenablog.com

*1:千野（2013）によると「球面性」ではなく「球形」とすべきと言われています。「表面だけでなく球内部も分布しているから」という理由で納得しましたが、ここでは検索へのかかりやすさの観点から「球面性」としました。

*2:差がないのに有意差ありとしてしまう

*3:グリーンハウス・ガイサーと読むそうです

*4:フィン・フェルトと読むそうです