roc分析
ROC 分析的基本原理ROC 是受试者工作特征(Receiver Operating Characteristic)或相对工作特征(Relative Operating Characteristic)的缩写。ROC分析五十年代起源于统计决策理
论,后来应用于雷达信号观察能力的评价。六十年代中期大量成功地用于实验心理学和心理物理学研究。Lusted首次提出了ROC分析可用于医学决策评价。自从八十年代起该方法广泛用于医学诊断性能的评价,如用于诊断放射学、实验室医学、癌症的筛选和精神病的诊断,尤其是医学影像诊断准确性的评价。ROC曲线的构建以假阳性率(FPF)为横轴,真阳性率(TPF)为纵轴。横轴与纵轴长度相等形成正方形。在图中将ROC 工作点标出,用直线连接各相邻两点构建成光滑ROC 曲线。构建光滑曲线需要假设对照组和病例组服从某种分布,用一曲线拟合技术估计参数,直接用参数产生。也可采用肉眼目测构建光滑曲线。注意:无论资料类型如何,曲线一定通过(0,0)和(1,1)这两点,这两点分别相当于灵敏度为0而特异度为1和灵敏度1为而特异度为0。理论上,完善的诊断有TPF=1 ,FPF=0,图中表现为ROC 曲线从原点垂直上升到图的左上角,然后水平到达右上角。完全无价值的诊断有TPF=FPF,是一条从原点到右上角的对角线。一般ROC 曲线位于正方形的上三角。
ROC曲线对诊断的准确性提供了直观的视觉印象,描述了相反两种状态间诊断系统的判别能力。曲线上的每一点代表了随着病例诊断阈值或置信阈变化的灵敏度与特异度的折衷。严格的标准产生较低的灵敏度和较高的特异度,ROC点位于曲线的左下。方宽松的标准产生较高的灵敏度和较低的特异度,ROC点位于曲线的右上方。如果比较的诊断系统曲线不交叉,则较高的ROC曲线具有较好的诊断性能。如果曲线交叉,可在考虑费用与效益的前提下结合统计学检验判断其诊断性能。ROC 分析的准确性评价指标一般用“ROC曲线下面积”反映诊断系统的准确性。理论上这一指标取值范围为0.5至1, 完全无价值的诊断为0.5,完善的诊断为1。该指标及其标准误的计算目前有非参数、
半参数和参数方法。其中得到广泛应用的方法有:Wilcoxon 非参数法和最大似然估计双正态参数法。最佳工作点的选择阳性似然比为真阳性率与假阳性率之比,即等于TPF/FPF;约登(Youden)指数为真阳性率与假阳性率之差,即等于TPF-FPF。一般选择阳性似然比或约登指数最大者为最佳工作点。
也有人采用 C/B [(1-P)/P]计算最佳工作点的斜率。表达式中C、B和P分别表示花费、收益和患病率。在假定对病例组实施治疗而对对照组不治疗的前提下,这一表达式表示治疗疾病的花费Cost 和收益Benefit 之比与(1-患病率)和患病率(Prevalence)之比的乘积。在ROC 曲线上,从(FPF,TPF)=(0,0)到(1,1),工作点斜率从大到小单调改变。从表达式可以看出,如果疾病治疗花费多,收益少,或患病率,低则斜率大,最佳工作点接近(0,0),确保了假阳性的减少。如果疾病治疗花费少,收益多,或患病率高,则斜率小,最佳工作点接近(1,1)确保了假阴性的减少。