指标用于病灶检测
注释说明
在病灶检测中,以下术语通常被用于衡量模型性能:
- TP (True Positives): 实际为真,预测也为真。
- FP (False Positives): 实际为假,预测为真(假阳性)。
- TN (True Negatives): 实际为假,预测也为假。
- FN (False Negatives): 实际为真,预测为假。
其中,TP + FN
表示实际所有正例的总数,TP + FP
表示预测为正的所有样例的总数。
关键性能指标
- 准确率(Precision)
准确率表明在预测为正的所有样例中,预测正确的比例。
Precision = T P T P + F P \text{Precision} = \frac{TP}{TP + FP} Precision=TP+FPTP
- 召回率(Recall)(也称为 Sensitivity)
召回率表示在所有实际正例中,模型正确识别的比例。
Recall = T P T P + F N \text{Recall} = \frac{TP}{TP + FN} Recall=TP+FNTP
- 特异性(Specificity)
特异性指的是在所有实际负例中,模型正确识别的比例。
Specificity = T N T N + F P \text{Specificity} = \frac{TN}{TN + FP} Specificity=TN+FPTN
- F1 分数
F1 分数是准确率和召回率的调和平均数,用于衡量模型的精准度和稳健性。
F 1 Score = 2 × Precision × Recall Precision + Recall F_1 \text{ Score} = 2 \times \frac{\text{Precision} \times \text{Recall}}{\text{Precision} + \text{Recall}} F1 Score=2×Precision+RecallPrecision×Recall
注意:在不同场景下,需要选择适合的指标。例如,在医学影像分析中,通常更重视提高召回率以避免漏诊,即使这样做可能会增加假阳性的数量。
分割性能指标
- Dice 系数(DSC)
Dice 系数用于衡量两个样本的相似度,经常用于医学图像分割。
DSC = 2 × ∣ I 1 ∩ I 2 ∣ ∣ I 1 ∣ + ∣ I 2 ∣ \text{DSC} = \frac{2 \times |I_1 \cap I_2|}{|I_1| + |I_2|} DSC=∣I1∣+∣I2∣2×∣I1∩I2∣
其中 I_1
和 I_2
分别表示两个分割区域。Dice 系数的值越接近 1,表示分割结果与真实情况越接近。
实现提示:将两幅分割的图像转换为一维数组,计算两数组中相同位置的元素(对应相同类别的像素)的数量来实现这一指标。
- Jaccard 距离(IOU)
Jaccard 距离(或称为交并比)也用于衡量分割的准确性。
JD = ∣ I 1 ∩ I 2 ∣ ∣ I 1 ∣ + ∣ I 2 ∣ − ∣ I 1 ∩ I 2 ∣ = ∣ I 1 ∩ I 2 ∣ ∣ I 1 ∪ I 2 ∣ \text{JD} = \frac{|I_1 \cap I_2|}{|I_1| + |I_2| - |I_1 \cap I_2|} = \frac{|I_1 \cap I_2|}{|I_1 \cup I_2|} JD=∣I1∣+∣I2∣−∣I1∩I2∣∣I1∩I2∣=∣I1∪I2∣∣I1∩I2∣
- Hausdorff_95 (95% HD)
Hausdorff距离是一个衡量两个点集之间最大不相似性的指标。在医学图像分割中,它被用来计算分割预测( I 2 I_2 I2)与实际的地面真相(ground truth, I 1 I_1 I1)之间的距离。95% Hausdorff距离(95% HD)是一种更鲁棒的变体,它通过考虑距离的95th百分位数来减少极端值的影响。
Hausdorff_95 ( I 1 , I 2 ) = max ( h 95 ( I 1 , I 2 ) , h 95 ( I 2 , I 1 ) ) \text{Hausdorff\_95}(I_1, I_2) = \max\left(h_{95}(I_1, I_2), h_{95}(I_2, I_1)\right) Hausdorff_95(I1,I2)=max(h95(I1,I2),h95(I2,I1))
其中
h
95
(
I
1
,
I
2
)
h_{95}(I_1, I_2)
h95(I1,I2) 表示所有点
p
∈
I
1
p \in I_1
p∈I1 到集合
I
2
I_2
I2 中最近点的距离的95th百分位数,
h
95
(
I
2
,
I
1
)
h_{95}(I_2, I_1)
h95(I2,I1) 同理。
计算95% HD的步骤如下:
- 对于地面真相(GT)集合 I 1 I_1 I1中的每个点,找到与预测集合 I 2 I_2 I2中最近点的距离,形成一个距离集合 D I 1 → I 2 D_{I_1 \rightarrow I_2} DI1→I2。
- 对于预测集合 I 2 I_2 I2中的每个点,找到与地面真相集合 I 1 I_1 I1中最近点的距离,形成一个距离集合 D I 2 → I 1 D_{I_2 \rightarrow I_1} DI2→I1。
- 对两个距离集合 D I 1 → I 2 D_{I_1 \rightarrow I_2} DI1→I2和 D I 2 → I 1 D_{I_2 \rightarrow I_1} DI2→I1分别找到95th百分位数的值。
- 取这两个百分位数的最大值作为最终的95% HD值。
95% HD的值越小,说明预测分割与地面真相的形状越相似,分割质量越高。这个指标对于那些对边缘位置精度要求很高的应用尤为重要,因为它反映了预测和实际之间最大可能的差异。
总结
在实际应用中,这些指标可以帮助我们评估模型在病灶检测和分割任务中的性能,每个指标都有其重要性,选择哪个指标取决于具体的应用需求和上下文。例如,在医学图像分割中,通常希望最大化 Dice 系数和 Jaccard 距离,减小HD95,以确保分割的准确性最高,从而提供最可靠的诊断信息。