ねこすたっと

ねこの気持ちと統計について悩む筆者の備忘録的ページ。

Rothman拾い読み:測定誤差と情報バイアス

Rothman先生のModern Epidemiology(4th edition)をパラパラめくって拾い読みしたメモです。 今回は "Chapter 13:Measurement and Measurement Error" から、測定誤差について。

測定はあらゆる変数に関与すること。「疫学とは測定だ!」と言ってもいいんじゃないかと思うくらい大事なことですが、その大事さ・難しさはイマイチ認識されていないような気がします。

測定誤差(measurement error)とは

真の値と測定値との誤差に起因するバイアスを情報バイアス(information bias)と呼ぶ。

MEでは連続変数とカテゴリー変数で、測定における誤差の呼び方を使い分けている。

  • 連続変数の測定における誤差:測定誤差(measurement error)*1
  • カテゴリー変数の測定における誤差:誤分類(misclassification), 分類誤差*2(classification error)

測定における誤差の分類

1つ目は「誤差が変数の値に影響するかどうか」によって分類する方法。

  • 変数の値に影響されない場合:非差異的誤差(nondifferential error)
  • 変数の値に影響される場合:差異的誤差(differential error)

2つ目は「2つの変数の誤差が互いに独立しているかどうか」によって分類する方法。

  • 互いに独立している(他の変数の誤差に依存しない)場合:独立誤差(independent error)
  • 互いに独立していない(他の変数の誤差に依存する)場合:従属誤差(dependent error)

この2つの観点から4つのパターンに分類したのが下のイラストです(MEの図を手書きにしただけ)。

MEではこの後、測定誤差は概念レベル(そもそも測りたい概念を測定するのに適していない測定方法)、データ収集レベル、データ管理レベルで生じると説明されています。

測定誤差の影響

差異的誤差

例1:要因の有無で検査の質が変わる場合
喫煙者と非喫煙者が同じ検査を受けたとしても、喫煙者では肺気腫があるんじゃないかと疑うことで、肺気腫が見つかりやすいことがあるかもしれない。喫煙者の方が肺気腫が多く発生したとしても、その一部は喫煙そのものの影響ではなく、検査頻度が多かったことに起因すると考えられる。アウトカムの測定が要因の有無によって異なっている。

例2:アウトカムの有無で要因の拾い上げ方が変わる場合
胎児に奇形が見つかった場合、妊娠中の要因の曝露について些細なことでも思い出す可能性がある。思い出しバイアス(recall bias)としてよく知られている。要因の測定(=思い出し方)がアウトカムの有無によって異なっている。

上の2つはいずれも、測定方法の性能(感度・特異度)が均一でないことに起因している。同じ検査でも状況が違えば性能は変わりうるし、「記憶を辿る」ということも立派な測定の1つ。

非差異的誤差

差異的誤差で情報バイアスを生じるのはよくわかる。では、非差異的誤差ではどうか。必ずしも差が薄まってNULL(=差なし)へ向かうばかりではない。

MEでは要因の非差異的誤分類、疾患の非差異的誤分類と順に説明されているが、読みながらメモに取ったことは以下の3点。

  • 測定性能が極端に悪いとNULLを超えて反対方向に向かうこともある。
  • 要因が3カテゴリー以上ある場合は、非差異的誤分類によりNULLと反対方向に動きうる。
  • アウトカムについての非差異的誤分類は、差の指標についてはバイアスをもたらさないが、比の指標についてはバイアスをもたらしうる。

差異的にしろ非差異的にしろ、効果を過大評価することも過小評価することもあるので、誤分類の影響がどちらに向かうかを分析して考察せよとのこと。

おわりに

  • バイアス分析についてはまたいずれ勉強します。
  • 猫が吹き抜け階段の手すりに乗っていると、落ちないかヒヤヒヤしますが、向こうからすると大きなお世話なんでしょうね。

参考資料

*1:タイトルに使っている「広義の」測定誤差に対して、「狭義の」測定誤差と言えるかもしれません

*2:勝手に訳しました