推荐星级:
  • 1
  • 2
  • 3
  • 4
  • 5

基于n-gram重叠度的翻译质量评估方法

更新时间:2026-03-14 12:12:22 大小:19K 上传用户:潇潇江南查看TA发布的资源 标签:质量评估 下载积分:2分 评价赚积分 (如何评价?) 打赏 收藏 评论(0) 举报

资料介绍

一、方法概述

n-gram重叠度评估是通过计算机器翻译输出与人工参考译文之间n元序列的重合程度,来量化翻译质量的自动评估方法。该方法基于"好的翻译应与人工译文在词汇序列上高度相似"的假设,通过滑动窗口提取连续n个词的序列(n-gram),统计模型输出与参考译文的共同n-gram数量占比,以此反映翻译的忠实度和流畅度。

二、核心原理

(一)n-gram定义

n-gram指文本中连续的n个语言单位(通常为词或字符)。常见类型包括:

· 1-gramUnigram:单个词的序列,如"//自然语言处理"

· 2-gramBigram:连续两个词的序列,如"我 爱/爱 自然/自然 语言/语言 处理"

· 3-gramTrigram:连续三个词的序列,如"我 爱 自然/爱 自然 语言/自然 语言 处理"

n值通常取1-4n越大对序列匹配的要求越严格,能更细粒度反映翻译的准确性。


部分文件列表

文件名 大小
基于n-gram重叠度的翻译质量评估方法.docx 19K

【关注B站账户领20积分】

全部评论(0)

暂无评论

上传资源 上传优质资源有赏金

  • 打赏
  • 30日榜单

推荐下载