马春杰杰 Exit Reader Mode

关于ROC和AUC的个人理解

这几天看论文,看到了一个评价指标:AUC。之前面对的都是mAP,或者TP/FP这种,对AUC没有太深的了解,就趁这个机会巩固一下关于AUC的相关内容。首先来看一张图:

这个就是大名鼎鼎的ROC曲线,而AUC就是这个曲线与X轴的面积。首先结论就是:AUC值越大越好,曲线越靠近左上角越好。然后来具体说一下这个曲线代表的含义。

首先说一下横纵坐标。横坐标是FPR,就是预测为正样本实际为负样本的个数占所有负样本的比例。而TPR为:预测为正样本实际也为正样本的个数占所有正样本的比例。这里有个判定,就是怎样才算正样本,怎样才算负样本。这个判定值就是阈值。大于这个阈值的,我们无脑认为它就是正样本,小于这个值的,我们认为它是负样本。给定这样一个阈值,我们就可以得到一对点(FPR, TPR),当我们给定不同的阈值时,由于判定条件改变,相应预测的正负样本的数量就会改变,(FPR, TPR)也会跟着改变,就这样,我们将阈值从最小到最大进行调节,就会得到所有的(FPR, TPR)点对。根据这些点对,我们就可以画出这个ROC曲线了。

为什么说这个ROC曲线越靠近左上角越好呢,因为纵坐标是TPR,我们总是希望结果中正确的样本个数所占的比例尽可能的高,横坐标是FPR,即预测结果中,负样本的个数尽可能的低。

再来看一下图中的这几条线,现在我们知道了,红色线的表现要好于蓝色线,而那条黑色线代表的是随机猜测的基准。如果我们得到的ROC曲线低于图中的黑色部分,那就代表我们这个模型的预测准确率还不如随机猜测的准确率高,那也就没什么意义了。

本文最后更新于2021年9月1日,已超过 1 年没有更新,如果文章内容或图片资源失效,请留言反馈,我们会及时处理,谢谢!