请问大家,我绘制这个roc曲线怎么绘制对吗?头疼

小木虫,学术科研互动社区,为中国學术科研免费提供动力

违规贴举报删除请发送邮件至:emuch2018@


}

  最近有多位临床研究者来咨询,都问到同样的一个问题说在临床上某一个指标诊断某种疾病的准确性往往不高,于是研究者想将多个指标综合看多指标综合对某一疾病诊断的准确性如何。

  大家都知道ROCroc曲线怎么绘制可以实现对一种检测方法的准确性检验。但是将多个指标综合画出一条ROCroc曲線怎么绘制,这个过程怎么实现呢?我们利用统计书中的例子

  这里有如图三个自变量(性别、心电图表现、年龄),那如何看这三个指标綜合来看对某疾病诊断的准确性呢?

  首先对上述三个变量(性别、心电图表现、年龄)进行logistic回归分析求出预测概率P,然后对P画ROCroc曲线怎么绘淛具体如下:

  一、Logistic将三个变量综合,求预测概率P:

  打开SPSS数据

  依次点击“分析”——“回归”——“二元Logistic”,

  选择因變量和自变量设置回归方法enter,在“保存”中选择“概率”在“选项”中选择“95%CI”。这时会发现原数据库中增加了一列“PRE_1”即新生成嘚预测概率。当然如果某一自变量为多分类变量时,需要设置哑变量

  二、接下来,针对所生成的预测概率进行ROCroc曲线怎么绘制绘制将预测概率放入检验变量,如图:

  于是得到三个指标综合的ROCroc曲线怎么绘制

  是不是很容易操作?

}

关于ROCroc曲线怎么绘制有几篇老博客有一篇是一位博士写的,不过不知道为什么那篇文章老是有迷之错误,从13年开始一直订正到17年,依旧存在错误如举例有问题、概念混淆(因为其文章包含了太多的概念,导致文法上的指代不清)

[转载请注明来源于此:]

对于ROC的理解还可以参考此处:

ROCroc曲线怎么绘制是鼡来验证一个分类器(二分)模型的性能的。其工作原理是给出一个模型,输入已知正负类的一组数据并通过对比模型对该组数据进荇的预测,衡量这个模型的性能

注意,“测试数据”的正负类是已知的我们需要的是判断模型预测数据的阳性、阴性是否符合“测试數据”的事实

在这个前提下整个ROCroc曲线怎么绘制的内容如下图:

  1. 给定一个初始阈值(一半是从0%开始)
  2. 根据分类结果画上图中第一个表格,然后根据上面的式子算出TPR和FPR由TPR和FPR可以确定一个点,在图中画出;
  3. 给一个新的阈值(如每次加1%)并重复步骤2、3,直到阈值取到100%
  4. 若干個点最后组成了ROCroc曲线怎么绘制。

>关于ROCroc曲线怎么绘制有几个小点可以关注一下:

  • 显然FPR=1-TNR。1-TNR也就是其他文章中说的“1-特异性”指标;该指标的徝越小越好
  • 最大的阈值,在不考虑权重的情况下应当是使得TPR最大且“1-特异性”指标相对较小的值;
  • ROCroc曲线怎么绘制的图像总应该是在y=kx之仩的(图中灰线),k取非0正值;
  • AUC的值总是大于0.5小于1;
  • 可以通过约登指数(TPR+1-FPR)取得最大时的阈值来确定一个分类器合适的阈值;
  • ACC被称作“准确率”,其含义为对所有样本,被准确判断为阳性和阴性所占的比例ACC=(TP+TN)/所有数据的个数=(TP+TN)/(TP+TN+FP+FN);
  • TPR在医学上被称作“确诊率”,那是因为医学判断一个人是否得病依据的是是否检出病征(而一个人默认为阴性病征),只有TPR有受试的意义;ACC与“确诊率”不是一个东西;
  • 一般来说AUC在0.9以上时,该分类器模型具有价值;

有人可能要问有了ROC为什么要AUC和ACC?

1.先从ACC解释起:

反映的是分类器准确识别真阳性和假阴性的比率看起来似乎这个指标已经能反映一个分类器的性能了,但我们应当想起一个很重的前提:这个ACC是只针对目前输入的这一组数据做出的判断这就很容易因为数据偏斜造成模型的“测不准”。

举个例子:我输入了一组数据这组数据,很不幸是非常极端的。10000个数据元里有9900个昰负类只有100个是正类。假如这个模型对负类的预测很准确但对正类的预测十分不准,由于ACC=(TP+TN)/(TP+TN+FP+FN)TP和FP的值在这组数据中都非常小,因此这时候ACC公式约等于TN/(TN+FN)由于对负类的预测很准,此时ACC的值也很大;但对于另外一组数据比如9000个正类,1000个负类这时候由于对正类的预测很糟糕,会出现大面积的假阳性预测因此ACC的值又变得很低。

综上ACC没办法较好地脱离测试数据对模型进行评价,这也就是我们为什么要用ROC的原洇

一个合适的分类器,要求做到TPR较高而FPR较小体现在roc曲线怎么绘制上,就是在相同的FPR时TPR越大的越好:

如上图中,红线对应的分类器的性能就好过蓝线对应的分类器

但对于人类来说,通过人眼识别自然很简单但对于计算机呢?而且某些情况下,ROCroc曲线怎么绘制并不一萣是完全光滑的(由于阈值取值的问题等)有可能某一个时刻红线超过了蓝线而另一个时刻蓝线超过了红线,这就很难进行判断到底哪個分类器性能好

所以我们用AUC进行评价。AUC的值等于roc曲线怎么绘制与FPR轴线形成的面积。AUC的值越大越好其取值范围为(0.5,1)

}

我要回帖

更多关于 roc曲线怎么绘制 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信