記述疫学のように対象者自体の特徴を明らかにすることを目的とする場合を
除いては、標本より得られたデータを基により広い範囲に適応したいと考えるの
が普通でしょう。しかし、標本データの結果をそのまま母集団に当てはめること
はできません。なぜなら、標本集団が母集団より抽出されたものであるとしても
、新たに生まれた集団は元のものと異なる可能性があるからです。たとえ無作為
化抽出しても、年齢構成や性別、暴露程度などの分布が偏ってしまうことはあり
ます。だからと言ってより大きな母集団(例えば全日本人)について網羅的に調
べることも不可能です。そこで、標本集団の結果がどの程度母集団の真の値に合
致するか推定する必要が生じてきます。推定の仕方には、あるひとつの値がどの
くらいの確率で当てはまるかを知る点推定もありますが、より一般的なのは区間
推定です。区間推定では標本データより母集団の真の値がどの値の範囲にあるか
を明らかにすることてです。この区間推定を数量的に表現するものが信頼区間 confidence
intervals なのです。
信頼区間は通常、平均値を中心とする正規分布の2.5%より97.5%の範囲の値で
示されます。時には99%の信頼区間(つまり全体の99%にあたる0.5%より99.5%の範囲)で示されるこ
ともありますが、多くは95%信頼区間が用いられます。これは、真の値が取りう
る確率正規分布の95%をしめる、2.5%より97.5%の範囲に相当し、t分布の5%値を用いて求めるこ
とができます。例えば、100名の患者群と100名の対照群の血圧の差が6mmHgだと
すると、その95%信頼区間は1mmHgより11mmHgとなります。この1mmHgを下限信頼
限界 lower confidence limit、11mmHgを上限信頼限界 upper confidence limit
といいます。
相対危険度(RR)の95%信頼区間を求める式は、
95%CI=(RR)exp[±1.96√VAR(lnRR)]
=(RR)exp[±1.96√{(1−a/(a+c))/a+(1−b/(b+d))/b}]
オッズ比(OR)の95%信頼区間を求める式は、
95%CI=(OR)exp[±1.96√(1/a+1/b+1/c+1/d)] (ただし、a、b、c、dは「
相対危険度とオッズ比
」の項目の表の値)
95%信頼区間は別の言い方をすれば、5%の有意水準で母集団の真の値が取
りうる範囲ということもできます。
UPDATE:10/May/10'
© S. HARANO, MD,PhD,MPH