ねこすたっと

ねこの気持ちと統計について悩む筆者の備忘録的ページ。

Rothman拾い読み:疾病の発生・存在を表す指標

Rothman先生のModern Epidemiology, 4th edition(以下ME)をパラパラめくって拾い読みしたメモです。 今回は "Chapter 4:Measures of Occurrence" から、疾病の発生や疾病状態の存在に関する指標について。

「発生の指標」と「存在の指標」

疫学は

  • 人の集団を対象としている
  • 健康状態を興味の対象としている

を特徴としている。1つ目の集団(population)については先日まとめた。

necostat.hatenablog.jp

2つ目については、「健康状態に関するイベントがどれくらい発生するか」が最も興味があるところだろう。
ここでいうイベントとは例えば、

  • 健康な人が病気になる
  • ある疾患に罹患している人が死亡する
  • 寛解状態だった人で病勢が増悪する・再発する

などのこと。

これらのイベントが発生するかどうか観察するためには、「イベントを発生する可能性があるけど、まだ発生していない人(at risk状態の人)」と「イベントが発生するまで観察する時間」が必要である。

イベントがいつ発生したかはっきり分からない場合(先天奇形、緩徐に進行する変性疾患など)は、「発生」の代わりに疾患(などの状態)が「存在」することを指標にすることがある。この場合は発生するまで観察する時間は不要だが、どの時点での状態かが決まっていないといけない。

発生割合(incidence proportion)

観察開始後に集団に出入りがないとして、観察開始時の人数に対する発生者数の割合を発生割合(incidence proportion)と呼ぶ。つまり「発生割合 = 発生者数 / 全体数」。

  • 観察開始時点では全ての人は「イベントを発生していないが将来的に発生しうる状態」、つまり「at riskな状態」でなくてはならない
  • イベントを発生した人数は開始時点の人数を超えることはないので、発生割合は必ず0から1の値になる。
  • 分母も分子も同じ単位(人)なので、発生割合は無単位
  • 発生割合を定義するときは必ず「どの時点での話なのか」を特定しておかないと意味がない。死亡発生割合が10%と言っても、1週間で1/10なのか、50年で1/10なのかによって全然意味が違ってくる。

リスク(risk)という語は一般的になっているので色々な意味で使われがちだけど、疫学では「ある期間内に疾病を発生する確率」と定義されて使われることがある。発生割合はリスクの推定値になることは直感的に分かるだろう。Riskは個人についても定義できるので、集団の平均riskが推定されるという方が正確。

発生割合の裏返し、つまり「ある期間観察された時点でまだイベントを発生していない人の割合」は生存割合(survival proportion)と呼ばれ、これも便利な指標としてよく使われる。

発生した割合  p を発生しなかった割合  1-p で除したもの  \frac{p}{1-p}発生オッズ(incidence odds)と呼ばれる指標。発生割合が小さくない(例えば10%を超える)ときは、発生オッズは発生割合から乖離するため適切な近似にならないことに注意。

発生時間(incidence time)

発生時間(Incidence time)は観察開始時点(zero time)からイベントが発生した時点までの時間として定義される。集団における平均発生時間は「その集団において、イベントが発生するまで平均的にどれくらい待つことになるか」と捉えることができる。

イベント発生前に観察ができなくなってしまう「打ち切り(censoring)」があると、途中でフォローから脱落した人がいる場合や、そもそも全員がイベントを発生するとは限らない場合*1は、正確な発生時間が観察できない。この場合は次に説明する発生率が役に立つ。

発生率(incidence rate)

「死亡」は全員に発生しうるイベントであり、観察期間を130年くらい取れば必ず観察可能。しかし疫学ではしばしば、全員に発生するとは限らないイベントや、観察期間内には発生しないかもしれないイベントをアウトカムとして扱わなければならないことがある。このとき、発生時間は正確に測定できないので、person-time法*2を使る。

次の時間を各患者のperson-timeとしてカウントする。

  • イベントを発生した人は、イベントを発生するまでの時間(=発生時間)
  • イベントを発生しなかった人は、観察することができた期間(開始から追跡脱落や研究期間終了まで)

集団で発生したイベントの合計数を、集団におけるperson-timeの総和で割ったものが発生率(incidence rate)となる。 発生割合と比較した特徴としては、

  • 発生率は「人数」を「人数×時間」で割るので、単位は時間の逆数 year^{-1}, month^{-1} など)になる(発生割合は無単位)
  • 発生率が取る値の下限は0だが、上限はない(発生割合は0か1の範囲に収まる)

発生率(incidence rate)の他に、hazard rateやdisease intensityなどとも呼ばれることもある。これらはどちらかというと分母にくるperson-timeを極限に短くした「瞬間死亡率」として使われることが多い。

発生率は発生割合や発生時間と比べると、やや直感的に解釈しにくいかも。 例えば、「100人を1年観察するして1例発生する」と「1人を100年観察して1例発生する」という結果は、同じ発生率になってしまうので、発生の様式についてもっと詳細に表現するためには発生時間など他の指標が必要。

以上、発生の指標御三家をまとめたのが次のイラストです。

反復イベント(recurrent events)の発生率

人は1回しか死なない*3が、感染症の罹患や腫瘍再発などは同じ人で複数回観察されうる。

健康な人における感冒罹患であれば、1回目の罹患と2回目以降の罹患の前で、健康状態や生活様式の違いはほとんどないだろう。この場合は、初回と2回目以降のイベント発生を区別する必要がない(と考えて差し支えない)。2回目以降のイベントも1回目と同様にカウントして、「発生率 = イベント発生件数 / person-timeの総和」とすればよい。

しかし腫瘍再発を考えるとき、「再発した人は再々発しやすい」のであれば、初回と2回目(さらには3回目)を同じと考えることは難しい。1回目のイベントと2回目以降のイベントが無関係に発生していると仮定することに無理があるのであれば、何番目のイベントかに対応したperson-timeを計算する必要がある。

つまり、

  • 初回のイベント発生に対しては、観察開始から初回イベント発生までのperson-timeを対象とする。初回イベント発生後の時間はperson-time at riskにカウントしない。
  • 2回目のイベント発生に対しては、初回イベント発生時点から2回目のイベント発生までの観察時間をperson-timeとする(3回目以降も同様)。

として、 i 番目のイベント発生率を計算する。

有病割合(pervalence)

有病割合(pervalence)は厳密には発生の指標ではなく、疾病が存在している状態に注目した指標。イベント発生を観察するためには時間の流れが必要だったが、prevalenceのときは「ある一時点」を特定する必要あり。

「有病割合 = 疾患を有する人数 / 全体数」で計算される。「有病率」ではなく「有病割合」と呼ぶべきであることは、発生割合・発生率の違いから理解できる。

疾病を有する状態にある人で構成される部分集団をprevalence poolと呼ぶ。疾病に罹患するとprevalence poolに加入し、死亡や治癒でpoolから除外される。なので、すぐに治る疾患(感冒など)や死亡率が高い疾患(ARDSなど)は有病割合は低くなり、治癒もしないが死亡もしない疾患(糖尿病など)では有病割合が高くなる。後者は罹病期間が長い疾患とも捉えられるので、有病割合には発生率と罹病期間の両方が反映されることになる。

上のイラストで有病割合はバスタブの水位に相当します。

おわりに

  • 学んだこと:Incidence proportionは打率、incidence rateは防御率
  • 複数回観察されうる場合は、1回目と2回目が同質かどうか考える必要あり

参考資料

*1:人は皆いつか死ぬが、必ず癌になるとは限らない

*2:日本語としては人・時間法より人年法の方が馴染みがありそうなので、ここでは英語のままにします

*3:007を除く