生存分析において予後因子がひとつ、つまり単変量ならば単純に群間の比較
をすればその因子の影響を見ることができます。もし、予後因子が複数以上、つ
まり多変量であったらどうしたらよいでしょう。ここで多変量解析の考え方が必
要となります。
因子の影響を調べる方法として、1つの従属(目的)変数と1つの独立(説
明、または予測)変数の関係を見る単回帰分析があります。もし、独立変数が2
つ以上であれば、これと類似した方法として重回帰分析 multiple regression
を用います。たとえば、血清コレステロールが体重と年齢に関連することを示す
には次の式のようになります。
血清コレステロール=β0+β1・(体重)+β2・(年齢)
β0、β1、β2の記号は重み付け(回帰係数)で、対応する変数の値を乗じま
す。
もし、この方程式の係数が一連のデータより推定することができれば、各回
帰係数を標本誤差で除した結果は回帰係数がゼロと有意に差がある否かという検
定に用いることができます。もしある独立変数について有意でなかったなら、他
の独立変数が有意であったとしても、そのデータではその変数が転帰を予測する
因子とはならないものと推定できることとなります。
この方程式の右辺は「線形予測因子 linear predictor」と呼ばれています
。この変数は量的変数ばかりでなくカテゴリーの場合もあります。従ってもし、0
=男性、1=女性か、あるいは逆に1=男性、0=女性とコード化すればβ3・(性
別)という項を加えても差し支えありません。性別のようにコード化した変数は
ダミーとか指標変数 indicator variable と呼ばれます。人種などのように2群
以上のカテゴリーがある場合は、単純に「1、2、3、4、・・・」とする訳にはい
かず(なぜなら順位としての意義がないから)、カテゴリーの数より1つだけ少
ないダミー変数を作成し、「10、01、00」(3群の場合で2ダミー変数、すなわ
ちAでありBでないもの、AでなくBであるもの、AでもBでもないもの)とし
なければなりません。
1972年にDavid Cox 卿が生存分析の解析法として報告した重回帰分析型の手
法で、本質的にはログランク検定に等しく、一連の予後変数に基づく線形予測因
子を用いて全追跡期間に亘る平均相対危険度の対数を推定するものです。もし、
予測変数が1つだけであるとすると、回帰係数(β1)を指数化して、つまりexp(
β1)を計算することでそれに対応する変数の相対危険度が得られます。
変数が2つ以上の場合は、ある1つの回帰係数を指数化するとその方程式の
他のすべての予測変数で補正した相対危険度が得られます。値のある組み合わせ
に対して、すべての線形予測因子を指数化することでその組み合わせの総相対危
険度が求められます。
コックス回帰では定数項(β0)はありません。なぜなら、定数項は絶対的
な値の測定が行われている場合にのみ求められるもので、コックスの手法とは相
対的な(絶対的ではない)リスクを予測するものだからです。
UPDATE:10/May/10'
© S. HARANO, MD,PhD,MPH