ねこすたっと

ねこの気持ちと統計について悩む筆者の備忘録的ページ。

分散分析(ANOVA):球面性仮定

分散分析で満たすべき仮定として球面性の仮定(the assumption of sphericity)*1をよく目にしますが、きちんと勉強したことがなかったので(わかるところだけ)読んでみました。

分散分析に必要な仮定

異なる対象者同士で比較する被験者間分散分析(between-subjects ANOVA)には、

  • 観測が互いに独立である(independence of observations)
  • 各群内で正規分布している(normality)
  • 各群の分散が等しい(homogeneity of variance)

の3つの仮定が必要です。

同じ対象者に対して観察された値同士を比較する 被験者内分散分析(within-subjects ANOVA) 、あるいは反復測定分散分析(repeated measures ANOVA) では、上記に加え 球面性の仮定(the assumption of sphericity) が必要になります。

球面性の仮定は反復測定ANOVAにおいてF値が正確なF分布に従うための必要十分条件で、これが満たされていないと第1種過誤が増加してしまい*2、ANOVAの結果が不適切になってしまいます。

球面性の仮定とは

Lane (2016) の導入で、球面性について2通りの定義を紹介していました。

  • 2水準間の差の分散に基づいた定義方法
  • 直交対比(orthogonal contrast)の分散・共分散に基づいた定義方法

両者は同値ですが、前者の方が説明が分かりやすく、後者の方が一般化して複雑なデザインにも対応できます。

2水準間の差の分散に基づいた定義方法

要因に含まれる全ての2水準間について対象者内の差を計算し、その分散が全て等しいとき、球面性が満たされていると定義します。 下の表では、T1〜T3の3つの水準の差(T3-T2, T3-T1, T2-T1)を計算して、その分散が全て等しい値(=8)になっていることを示しています。 ちなみに分散分析では各群の分散が等しくなければいけないので、T1〜T3の分散も全て等しい値(=10)になっていることを示しています。

]

水準が2つしかない場合(例えば前値・後値を測定)、水準間差は1つしか存在しないので、「水準間によって分散が異なっている」という事態は発生せず球面性は常に成り立ちます。

直交対比の分散・共分散に基づいた定義方法

多重比較の手順の1つであるSchefféの方法で対比(contrast)が登場します。複数の平均値(例えば \mu_1, \mu_2, \mu_3, \mu_4)を比べるとき、任意の平均の比較は \mu_1, \mu_2, \mu_3, \mu_4の線型結合が0であるという形式で表すことができます。

例えば「1番目と2番目の平均が等しい」、つまり  \mu_1 = \mu_2 という仮説は、

 1 \times \mu_1 + (-1) \times \mu_2 + 0 \times \mu_3 +  0 \times \mu_4 = 0

と書けますし、「1番目の平均と他の3つの平均の平均が等しい」、つまり  \mu_1 = \frac{\mu_2 + \mu_3 + \mu_4}{3} という仮説は、

 1 \times \mu_1 + \left( -\frac{1}{3} \right) \times \mu_2 +  \left( -\frac{1}{3} \right)  \times \mu_3 +   \left( -\frac{1}{3} \right)  \times \mu_4 = 0

と書けます。

この線型結合の係数を 対比(contrast) といいます(各係数を要素に持つベクトルです)。

2つの対比が直交する(=内積が0)とき、この2つの対比は直交対比(orthogonal contrast)であると言います。 分散分析の帰無仮説である「p個の平均が全て等しい」、つまり \mu_1 = \mu_2 = ... = \mu_pという仮説は、「p-1個の直交対比が全て0である」という仮説に置き換えることができます(p-1個の直交対比の選び方は無数にありますが、互いに直交する対比は常にp-1個しか作れません)。

このp-1個の直交対比ベクトル(←各々がp個の要素からなる)を並べた(p-1)×p行列を直交対比行列(orthogonal matrix)と言います。 さらに、

  • 各行の和 = 0
  • 各行の長さ(平方和)= 1

という条件が追加されたものを正規直交対比行列(orthonormal contrast matrix)と言います。

元のデータの共分散行列  \Sigma を正規直交対比行列  C を使って、  C \Sigma C^{T} と変換したものが、対角成分が全て等しい対角行列  \lambda Iになっているというのが球面性の仮定です。

 C \Sigma C^{T} =  \lambda I

 \Sigma = E(X^{T} X) を鑑みてさらに読み砕くと、

元データXを正規直交対比行列で変換した X C^{T} の分散が等しく、かつ互いに相関がない というのが球面性の仮定の意味するところです。

直交対比に基づいた球面性の仮定については、名古屋大学大学院 教育発達科学研究科 心理発達科学専攻 計量心理学領域 石井研究室が公開している資料集を参考にしました。非常に分かりやすい資料でとても勉強になりましした。

検定方法

Mauchly(モクリー)の球面性検定がよく知られています。Mauchlyの統計量Wは0(球面性が成り立たない)〜1(完全に球面性OK)の値を取り、仮説が棄却された(P値が小さい)場合は球面性が成り立っていないと判断します。

もし被験者内要因(=反復測定要因)に加えて、被験者間要因を含むデザインでは、共分散行列が群ごとで等質かどうかを検証しなくてはなりません。Mauchly検定はこれに対応していません。球面性と共分散の等質性を一度に検定する方法としてMendozaの多標本球面性検定があります。

これについては井関先生が詳しく解説されています(井関先生が作成されたR関数ANOVA君ではMendoza検定がデフォルトになっているとのこと)。

riseki.php.xdomain.jp

球面性仮定が満たされなかったときの補正方法

球面性仮定が満たされていない場合、計算されたF値がF分布に従うとみなせなくなるので調整が必要です。ε統計量を使って分散分析の自由度を調整します。

データから計算されたF値をF(df1, df2)分布に当てはめてP値を計算するのではなく、F(ε×df1, ε×df2)分布に当てはめて計算します。当てはめるF分布の自由度が小さいほど計算されるP値は大きくなります。

ε統計量の計算方法はいくつかあります。いずれも0〜1の範囲で求められ、球面性が成り立っていないときほど0に近い値になるので、自由度は調整前よりも小さくなり、P値は調整前よりも大きくなります。

  • 下限値:εの取りうる理論的下限値です。1/(水準数-1)で計算できるのでPC不要ですが、保守的過ぎるので通常使いません。
  • Greenhouse-Geisser法*3:ε≧0.75のときには厳し過ぎるとのこと
  • Huynh-Feldt法*4:計算上1を超えることがありますが、その場合は1を用います。Lecoutre(ルクルト)による修正版が用いられていることが多く、Huynh-Feldt-Lecoutre法と呼ぶ方が良いかもしれません。
  • Chi-Muller法:計算上1を超えることも、下限値よりも小さい値になることもあるとのこと。GG法、HFL法の使い分けを気にせず、広い状況で優れている?

使い分けの詳細はまだ勉強しきれていません。ひとまずは

  • ε<0.75 → Greenhouse-Geisser法
  • ε≧0.75 → Huynh-Feldt-Lecoutre法

とざっくり覚えておきたいと思います。

おわりに

  • 理解という意味ではまだまだですが、出力された表に何が書いてあるかは分かるようになりました。
  • 猫の爪研ぎタワーから毎日大量のゴミが出ます。麻紐がとれて芯が剥き出しです。

参考資料

  • Lane, D. M. (2016). The assumption of sphericity in repeated-measures designs: what it means and what to do when it is violated. The Quantitative Methods for Psychology, 12(2), 114–122. doi:10.20982/tqmp.12.2.p114

  • 千野直仁. 行動研究における反復測定デザインANOVAの誤用 - I. 愛知学院大学心身科学部紀要第9号(45-52)(2013).

  • EZR, SPSSでの実行方法なども紹介されています。

toukeier.hatenablog.com

*1:千野(2013)によると「球面性」ではなく「球形」とすべきと言われています。「表面だけでなく球内部も分布しているから」という理由で納得しましたが、ここでは検索へのかかりやすさの観点から「球面性」としました。

*2:差がないのに有意差ありとしてしまう

*3:グリーンハウス・ガイサーと読むそうです

*4:フィン・フェルトと読むそうです