机器翻译,文本生成评估指标BELU,BERTSCORE

一:BLEU
     1.1  BLEU 的全称是 Bilingual evaluation understudy,BLEU 的分数取值范围是 0~1,分数越接近1,说明翻译的质量越高。BLEU 主要是基于精确率(Precision)的,下面是 BLEU 的整体公式。

                                  

  • BLEU 需要计算译文 1-gram,2-gram,...,N-gram 的精确率,一般 N 设置为 4 即可,公式中的 Pn 指 n-gram 的精确率。
  • Wn 指 n-gram 的权重,一般设为均匀权重,即对于任意 n 都有 Wn = 1/N。
  • BP 是惩罚因子,如果译文的长度小于最短的参考译文,则 BP 小于 1。
  • BLEU 的 1-gram 精确率表示译文忠于原文的程度,而其他 n-gram 表示翻译的流畅程度。 


参考:

机器翻译评价指标之BLEU详细计算过程_bleu4是20-CSDN博客

机器翻译, 文本生成等任务评价指标 BLEU, ROUGE, PPL(困惑度)_ppl困惑度升高-CSDN博客

【文本生成】评价指标:BERTScore-CSDN博客

BERTScore——一种衡量两段文本相似度的方法-CSDN博客

相关推荐

  1. 机器翻译评价指标 BLEU分数

    2023-12-05 16:34:05       46 阅读
  2. 机器翻译常用指标BLEU

    2023-12-05 16:34:05       37 阅读
  3. 机器翻译.

    2023-12-05 16:34:05       42 阅读
  4. 机器翻译

    2023-12-05 16:34:05       35 阅读
  5. 模型评估指标

    2023-12-05 16:34:05       53 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2023-12-05 16:34:05       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2023-12-05 16:34:05       100 阅读
  3. 在Django里面运行非项目文件

    2023-12-05 16:34:05       82 阅读
  4. Python语言-面向对象

    2023-12-05 16:34:05       91 阅读

热门阅读

  1. 我的创作纪念日

    2023-12-05 16:34:05       51 阅读
  2. Linux设备与STM32 USB串口通讯

    2023-12-05 16:34:05       60 阅读
  3. 23年9月-11月工作笔记整理(前端)

    2023-12-05 16:34:05       62 阅读
  4. 微前端前置知识----webComponents

    2023-12-05 16:34:05       53 阅读
  5. 大数据的技术栈-逐步完善

    2023-12-05 16:34:05       68 阅读
  6. Qt Location中加载地图对象

    2023-12-05 16:34:05       58 阅读