Bootstrap

TPAMI 2024 | 学生损失:走向不准确监督中的概率假设

题目:Student Loss: Towards the Probability Assumption in Inaccurate Supervision

学生损失:走向不准确监督中的概率假设

作者:S. Zhang; J. -Q. Li; H. Fujita; Y. -W. Li; D. -B. Wang; T. -T. Zhu; M. -L. Zhang; C. -Y. Liu


摘要

在数据集中常常会遇到噪声标签,但学习它们是具有挑战性的。尽管在噪声类别中干净和被误标的样本之间存在自然差异,但该领域的大多数技术仍然不加区分地收集它们,这导致它们的性能部分是鲁棒的。在本文中,我们从经验和理论上揭示了通过假设具有相同标签的深层特征遵循学生分布,可以提高学习的鲁棒性,从而提出了一种更直观的方法,称为学生损失。通过嵌入学生分布并利用其曲线的陡峭性,我们的方法自然具有数据选择性,可以提供额外的强度来抵抗误标样本。这种能力使得干净的样本在中心紧密聚集,而误标的样本分散开来,即使它们共享相同的标签。此外,我们采用度量学习策略,开发了一个大间距学生(LT)损失以提高能力。需要注意的是,我们的方法是第一个在特征表示中采用先验概率假设以减少误标样本贡献的工作。这一策略可以增强各种损失,使其加入学生损失家族,即使它们已经是鲁棒损失。实验表明,我们的方法在不准确监督中更加有效。增强的LT损失在大多数情况下显著优于各种最先进的方法。在某些情况下甚至可以获得超过50%的巨大改进。

</

;