实现方式
对比最后一层出来的logit,和前面Layer出来的logit,消除差异过大的分布,从而降低幻觉:
最后一层Layer出来的logit容易的得到;
选择与最后一层的logit最不相似的分布的那层结果
实现原理
也是很简单的对比方式,最终的logit由最后一层的Layer输出的logit,减去前期选择的层的logit,
得到最终的logit
对比最后一层出来的logit,和前面Layer出来的logit,消除差异过大的分布,从而降低幻觉:
最后一层Layer出来的logit容易的得到;
选择与最后一层的logit最不相似的分布的那层结果
也是很简单的对比方式,最终的logit由最后一层的Layer输出的logit,减去前期选择的层的logit,
得到最终的logit