ねこすたっと

ねこの気持ちと統計について悩む筆者の備忘録的ページ。

Rothman拾い読み:選択バイアスと一般化可能性

Rothman先生のModern Epidemiology(4th edition)をパラパラめくって拾い読みしたメモです。 今回は "Chapter 5:Measures of Effect and Measures of Association" と "Chapter 14:Selection Bias and Generalizability" から、選択バイアスについて。

交絡の話のときに選択バイアスの話は少ししました。

necostat.hatenablog.jp

今回はもう少し範囲を広げてみます。

選択バイアス(selection bias)とは

研究対象集団から推定される発生の指標や効果の指標が、本来源泉集団から推定されるべき値と系統的にズレてしまうこと。

MEのChapter 14の導入では、次の3つのケースが選択バイアスが生じる状況の例として挙げられている。

アウトカムが対象者選択に関連する場合:
アウトカム(あるいはその上流にある因子)が研究参加に関連していると、研究対象集団から推定されるイベント発生頻度は源泉集団とは異なってくる。例えば、普段健康に気を使っていて、不健康なアウトカムを発生しにくい人ほど研究参加に手をあげる傾向があると、一般人口よりも不健康なアウトカムが少なくなってしまう。

要因とアウトカムの両方が対象選択の上流にある場合
これは以前、Rothman拾い読み:交絡と交絡因子 - ねこすたっとで「高血糖と担癌とICU」で説明した選択バイアス。要因とアウトカムの両方が研究参加の上流にあるとき、研究参加者に限定することで要因とアウトカムの間に関連の道が開いてしまう。

アウトカムが対象選択に関連し、対象選択の強度が要因に関連する場合
アウトカムが研究参加に関連していて、要因の程度によって研究にどの程度参加するかが異なる場合にもバイアスが生じる。 例えば治療薬Aとそれよりも有効性が高い治療薬Bがあって、治療薬Bの方が副作用のため自己中止してフォローから脱落しやすい場合は、フォローできた(研究参加できた)人だけを比べると治療薬Bの方がアウトカムが良さそうに見えてしまう。

一般化可能性

「研究対象集団で推定された結果が標的集団にも当てはめることができるか」ということ。ちなみに、研究対象集団で認められた効果を”efficacy”と呼び、標的集団における効果を”effectiveness”と呼ぶ。

次のような研究結果は一般化可能性に乏しい。

  • そもそも内的妥当性が乏しい場合
  • 効果修飾因子のprevalenceが研究対象集団と標的集団で異なっている場合(効果修飾因子のprevalenceに関する情報があれば標準化などで対応可能)

「一般化可能性を高めるために、ちゃんと代表性のあるサンプルを得ましょうね」と書かれているが、研究の効率などを考えるとトレードオフなところもある。

MEではgeneralizabilityとtransportabilityという2つの語が並列して使われているところが多いが、前者については、

generalizability pertains to the question of the extent to which a study’s estimate of occurrence or association applies to the larger population from which the study population was sampled.

とあるので、研究結果を源泉集団に当てはめられるかどうか、ということを述べている。 これに対して後者については、

Transportability is a concept related to generalizability. It pertains to the broader question of the extent to which a study’s estimate of occurrence or etiologic effect can be used to derive an estimate for a second population, whose membership was not sampled in the process of enrolling the study population.

とあるので、研究結果をサンプリングが行われなかった別の集団に対して適応できるか、ということを表している。あえて訳すと「外挿可能性」みたいな感じか。

選択バイアスが発生する状況

冒頭で述べた、選択バイアスが生じうる状況の例の2つ目、3つ目をまとめると、要因とアウトカムの両方が、直接的あるいは間接的に研究対象者の選択に影響すると選択バイアスが生じる。
ここでは選択バイアスが起こってないか注目する場面を挙げている。

研究への参加登録の場面:
研究参加に対象者の同意を必要とする研究において、研究への参加に同意するかどうかが要因・アウトカムに影響をうける場合は選択バイアスを生じる。例えば、ケースコントロール研究では対象者は自分の要因・アウトカムを知っているので、それが研究参加に影響するとバイアスを生じてしまう。研究参加同意の撤回はいつでも許容されるので、ランダムに割り付けられた治療の盲検化が解かれた後での同意撤回が群間で偏るとバイアスに繋がりうる。

フォロー脱落の場面:
要因・アウトカムによってフォローから脱落する確率が変わる場合には、選択バイアスを生じる。治療薬の効果・副作用によって参加継続希望に差が生じないか、アウトカムの発生あるいは発生しやすさに影響する重症度によって脱落しやすくないか、などを考える。

研究ボランティアを募る場面:
「健康に関心がある人ほど研究参加に手を挙げやすい」というもの。自己選択バイアス(self-selection bias)とかボランティアバイアス(volunteer bias)の名前でよく知られている。

アクセスしやすい対象者に絞る場面:
例えば入院患者のように、情報を取りやすいなどの理由で研究実施に都合がいい患者に限定することによって生じる選択バイアス。1946年にBerkson氏が報告したため、バークソンバイアス(Barkson's bias, Berksonian bias)と呼ばれる。

下は、要因(E)とアウトカム(D)を2値変数ではなく、それぞれの傾向として模式的にグラフにしたものです。 源泉集団では両者に関連がないのに、Eが低くてDも低い人が対象に選ばれないようにすると、研究対象集団ではEとDに関連が出てきちゃうというイラストです。

おわりに

  • 選択バイアスが発生する場面は色々ですが、機序(DAGでの話)になると共通項が見えて面白いですね。

参考資料