二元Logistic回归分析
logistic回归多重线性回归分析,该分析方法是研究一个因变量(服从正态分布)与多个自变量的数量关系。
在医学研究中,常常需要研究的结局变量不是连续型变量,而是二分类变量或多分类变量,logistic回归分析就能解决这问题。
依据因变量的分类情况,可分为二分类logistic回归和多分类logistic回归;依据研究设计的不同,可分为非条件logistic回归和条件logistic回归。
1
案例分析
为研究鼻咽癌发病的危险因素,研究人员对某医院肿瘤防治中心放疗科的105例鼻咽癌新发病例与130名健康人进行病例—对照研究。被调查者的性别(女:0,男:1)、年龄(岁)、鼻咽癌家族史(否:0,是:1)、慢性鼻炎史(否:0,是:1)、职业接触有害物质(否:0,是:1)、吸烟(否:0,是:1)、饮茶(否:0,是:1)、长期锻炼(否:0,是:1)、生活工作压力(否:0,是:1)、鼻咽癌是否发生(否:0,是:1)。
视图变量
数据视图
探求因变量与多个自变量之间关系(若为连续性资料,考虑用多重线性回归分析),该资料因变量为二分类变量,故采用二元logistic回归分析。
2
手把手教你
(一)单击“分析” “回归” “二元logistic”
(二)弹出如下对话框
(三)选入相应的因变量和自变量,如图所示
(四)单击“分类”,将各分类变量选入“分类协变量”框中,将参考类别选中“第一个”,单击“更改”(系统默认的为最后一个,具体区别及结果解读可参考后面)
(五)单击“选项”,勾选“Hosmer-Lemeshow拟合度”和“exp”(OR值),继续
3
结果分析
①该结果显示各变量的编码情况
②模型系数的Omnibus检验表明该模型总体有意义,R平方值越接近1,回归模型拟合越好。
③“Hosmer-Lemeshow”检验,sig=0.533>0.05,即模型拟合优度较高
④
该结果显示,肿瘤家族史(P<0.001,OR=7.563)、职业有害接触(P=0.022<0.05,OR=2.381)、吸烟(P<0.001,OR=5.059),锻炼(P=0.003<0.05,OR=0.338)纳入模型中有统计学意义;常量,即截距,在模型中无实际意义。
OR值解读
以肿瘤家族史为例:有肿瘤家族史的人患鼻咽癌 是 无肿瘤家族史的7.563倍,即为危险因素。肿瘤家族史(无:0,是:1),前面设置协变量的参考类别为“第一个”,即“0”,方程中给出的exp(B)也是相对于“0”。对于连续型变量,如:年龄(当然,年龄在此研究中不起作用),即年龄每增加1岁,患鼻咽癌的风险增加n(OR)倍。
如果将分类协变量的参考类别为默认,结果如下:
同样以肿瘤家族史为例,无肿瘤家族史患鼻咽癌是有肿瘤家族史的0.132倍,为保护因素。
logistic回归模型中,卡方值=87.589,P<0.001, 认为该模型有统计学意义。其中,肿瘤家族史、职业有害接触和吸烟是鼻咽癌发生的危险因素,体育锻炼为保护因素。必要的话,还可以写出logistic回归方程。