L1 平均绝对误差MAE
L2 均方误差MSE
交叉熵CE
用于度量两个概率分布之间的差异性信息。
对交叉熵求最小值,也等效于求最大似然估计。
在机器学习领域,我们令P(x)为预测集,Q(x)为真实数据集。