Bootstrap

医学影响分割性能常用指标(用于病灶检测)

指标用于病灶检测

注释说明

在病灶检测中,以下术语通常被用于衡量模型性能:

  • TP (True Positives): 实际为真,预测也为真。
  • FP (False Positives): 实际为假,预测为真(假阳性)。
  • TN (True Negatives): 实际为假,预测也为假。
  • FN (False Negatives): 实际为真,预测为假。

其中,TP + FN 表示实际所有正例的总数,TP + FP 表示预测为正的所有样例的总数。

关键性能指标

  1. 准确率(Precision)
    准确率表明在预测为正的所有样例中,预测正确的比例。

Precision = T P T P + F P \text{Precision} = \frac{TP}{TP + FP} Precision=TP+FPTP

  1. 召回率(Recall)(也称为 Sensitivity)
    召回率表示在所有实际正例中,模型正确识别的比例。

Recall = T P T P + F N \text{Recall} = \frac{TP}{TP + FN} Recall=TP+FNTP

  1. 特异性(Specificity)
    特异性指的是在所有实际负例中,模型正确识别的比例。

Specificity = T N T N + F P \text{Specificity} = \frac{TN}{TN + FP} Specificity=TN+FPTN

  1. F1 分数
    F1 分数是准确率和召回率的调和平均数,用于衡量模型的精准度和稳健性。

F 1  Score = 2 × Precision × Recall Precision + Recall F_1 \text{ Score} = 2 \times \frac{\text{Precision} \times \text{Recall}}{\text{Precision} + \text{Recall}} F1 Score=2×Precision+RecallPrecision×Recall

注意:在不同场景下,需要选择适合的指标。例如,在医学影像分析中,通常更重视提高召回率以避免漏诊,即使这样做可能会增加假阳性的数量。

分割性能指标

image.png

  1. Dice 系数(DSC)
    Dice 系数用于衡量两个样本的相似度,经常用于医学图像分割。

DSC = 2 × ∣ I 1 ∩ I 2 ∣ ∣ I 1 ∣ + ∣ I 2 ∣ \text{DSC} = \frac{2 \times |I_1 \cap I_2|}{|I_1| + |I_2|} DSC=I1+I22×I1I2

其中 I_1I_2 分别表示两个分割区域。Dice 系数的值越接近 1,表示分割结果与真实情况越接近。
实现提示:将两幅分割的图像转换为一维数组,计算两数组中相同位置的元素(对应相同类别的像素)的数量来实现这一指标。

  1. Jaccard 距离(IOU)
    Jaccard 距离(或称为交并比)也用于衡量分割的准确性。

JD = ∣ I 1 ∩ I 2 ∣ ∣ I 1 ∣ + ∣ I 2 ∣ − ∣ I 1 ∩ I 2 ∣ = ∣ I 1 ∩ I 2 ∣ ∣ I 1 ∪ I 2 ∣ \text{JD} = \frac{|I_1 \cap I_2|}{|I_1| + |I_2| - |I_1 \cap I_2|} = \frac{|I_1 \cap I_2|}{|I_1 \cup I_2|} JD=I1+I2I1I2I1I2=I1I2I1I2

  1. Hausdorff_95 (95% HD)
    Hausdorff距离是一个衡量两个点集之间最大不相似性的指标。在医学图像分割中,它被用来计算分割预测( I 2 I_2 I2)与实际的地面真相(ground truth, I 1 I_1 I1)之间的距离。95% Hausdorff距离(95% HD)是一种更鲁棒的变体,它通过考虑距离的95th百分位数来减少极端值的影响。

Hausdorff_95 ( I 1 , I 2 ) = max ⁡ ( h 95 ( I 1 , I 2 ) , h 95 ( I 2 , I 1 ) ) \text{Hausdorff\_95}(I_1, I_2) = \max\left(h_{95}(I_1, I_2), h_{95}(I_2, I_1)\right) Hausdorff_95(I1,I2)=max(h95(I1,I2),h95(I2,I1))

其中 h 95 ( I 1 , I 2 ) h_{95}(I_1, I_2) h95(I1,I2) 表示所有点 p ∈ I 1 p \in I_1 pI1 到集合 I 2 I_2 I2 中最近点的距离的95th百分位数, h 95 ( I 2 , I 1 ) h_{95}(I_2, I_1) h95(I2,I1) 同理。
计算95% HD的步骤如下:

  1. 对于地面真相(GT)集合 I 1 I_1 I1中的每个点,找到与预测集合 I 2 I_2 I2中最近点的距离,形成一个距离集合 D I 1 → I 2 D_{I_1 \rightarrow I_2} DI1I2
  2. 对于预测集合 I 2 I_2 I2中的每个点,找到与地面真相集合 I 1 I_1 I1中最近点的距离,形成一个距离集合 D I 2 → I 1 D_{I_2 \rightarrow I_1} DI2I1
  3. 对两个距离集合 D I 1 → I 2 D_{I_1 \rightarrow I_2} DI1I2 D I 2 → I 1 D_{I_2 \rightarrow I_1} DI2I1分别找到95th百分位数的值。
  4. 取这两个百分位数的最大值作为最终的95% HD值。

95% HD的值越小,说明预测分割与地面真相的形状越相似,分割质量越高。这个指标对于那些对边缘位置精度要求很高的应用尤为重要,因为它反映了预测和实际之间最大可能的差异。

总结

在实际应用中,这些指标可以帮助我们评估模型在病灶检测和分割任务中的性能,每个指标都有其重要性,选择哪个指标取决于具体的应用需求和上下文。例如,在医学图像分割中,通常希望最大化 Dice 系数和 Jaccard 距离,减小HD95,以确保分割的准确性最高,从而提供最可靠的诊断信息。

;