平均绝对误差(Mean Absolute Error, MAE)是回归模型评估中常用的一种误差度量方式。它衡量的是模型预测值与实际观测值之间差异的平均大小,但只考虑绝对值,不考虑正负。
MAE的计算公式:
对于一组数据点(𝑥1,𝑦1),(𝑥2,𝑦2),...,(𝑥𝑛,𝑦𝑛)(x1,y1),(x2,y2),...,(xn,yn),其预测值分别为𝑦^1,𝑦^2,...,𝑦^𝑛y^1,y^2,...,y^n,MAE 计算公式如下:MAE=1𝑛∑𝑖=1𝑛∣𝑦𝑖−𝑦^𝑖∣MAE=n1∑i=1n∣yi−y^i∣其中:
𝑛n 是数据点的总数。
𝑦𝑖yi 是第 𝑖i 个观测值。
𝑦^𝑖y^i 是第 𝑖i 个预测值。
∣𝑦𝑖−𝑦^𝑖∣∣yi−y^i∣ 是第 𝑖i 个观测值与预测值之间的绝对误差。
MAE的特点:
简单直观:MAE 容易理解和计算,它直接反映了预测误差的平均大小。
稳健性:由于只考虑绝对误差,MAE 对异常值(outliers)具有一定的稳健性,不会像平方误差那样被极端值过分影响。
无单位:MAE 的结果与原始数据具有相同的单位,这使得它在不同模型或不同数据集之间的比较变得直观。
MAE的应用:
MAE 常用于评估回归模型的性能,尤其是在预测连续值时。
它也用于比较不同模型的预测精度,选择误差最小的模型。
MAE的局限性:
尽管 MAE 对异常值有一定的稳健性,但它仍然会受到较大误差的影响,只是影响程度不如平方误差(如均方误差 MSE)。
MAE 没有考虑到误差的方向,即它不区分正误差和负误差。
MAE与其他误差度量的比较:
均方误差(Mean Squared Error, MSE)是另一种常用的误差度量方式,它考虑了误差的平方,因此对大误差更加敏感。
均方根误差(Root Mean Squared Error, RMSE)是 MSE 的平方根,它与 MAE 一样,结果与原始数据具有相同的单位,但对大误差的敏感度介于 MAE 和 MSE 之间。
在选择误差度量方式时,需要根据具体问题和数据的特点来决定使用哪种度量方式。例如,如果模型的预测误差对业务影响很大,可能更倾向于使用 MSE 或 RMSE;如果希望模型对异常值更稳健,则可能选择 MAE。