新疆都市报 > 科技 > 智能 >

人工智能技术如何革新同声传译服务?

发布时间:2020-07-29 21:36来源: 网络整理

  7月25日-26日,2020全球人工智能技术大会在杭州拉开帷幕,近160位国内外人工智能领域的专家、学者汇聚杭州,围绕AI学科前沿和尖端技术展开研讨,共话AI未来。本次大会共吸引了超过1100万人次在线观看,为了让国内外观众第一时间了解大会内容,百度翻译为大会提供了机器同传服务。

  随着经济全球化的深入,国际交流日益频繁,各类国际会议数量不断攀升,超过95%的国际高端会议都采用同声传译的方式。据不完全统计,2019年在中国举办的国际会议超过13000场,而国际会议口译员协会(AIIC)——会议口译唯一的全球性专业协会——仅有约3000名会员,其中汉语普通话会员只有51人。在供需严重不平衡的情况下,能力日益增强的机器同传在国际会议场景下身影频现。

  面对领域多样、需求复杂、实时性高的会议场景,百度翻译提供了全面高效的机器同传解决方案。

  懂语义、观全局,翻译质量高、时间延迟小

  语义单元驱动的同传模型,结合全局话题信息,兼顾质量与效率

  一直以来,如何平衡时延与准确度都是同声传译的难点问题。如下图所示,传统的文本翻译等待原文输入结束后才进行翻译,无法满足同传高实时性要求。要降低时间延迟,就需要对演讲者的内容“同步”翻译,但这样由于缺乏完整的上下文语义信息,会导致翻译出错。

  针对以上问题,百度翻译提出业界首个“语义信息单元驱动的机器同传模型”(效果如下图),实时判断演讲者所讲内容是否形成了完整的语义单元,判断为是则进行翻译,否则继续等待。该技术大幅提升了翻译准确性,同时缩小了时延。

  语义信息单元驱动的机器同传模型

  (横向箭头代表一个语义单元,纵向箭头表示翻译结果)

  此外,传统的翻译模型一般仅针对当前的输入内容进行翻译,由于缺乏全局信息导致翻译不准确。例如,下面的例子中,在不同的话题下,单词有不同的释义。针对这一问题,提出了融合全局话题信息的翻译模型,进一步提升了翻译准确率。

  专业领域定制翻,哪怕术语多又难

  缓解会议涉及的专业领域难度大,通用模型翻译专业性欠佳的问题

  俗话说,隔行如隔山,在涉及专业领域如医药、科技等场景下,想要准确地翻译术语,往往需要同传译员在会前很短的时间内了解和熟悉大量相关领域的专业知识。如果一场大会包含多场分论坛,专业领域差异大,译员要同时支持数场论坛同传,更是难上加难。

  百度翻译医药领域翻译效果

  如果用没受过“特殊训练”的机器来翻译,其翻译结果也可能不尽如人意(如上图所示)。针对此类问题,百度翻译通过迁移学习、预训练加精细化训练等技术,迅速提升领域模型的翻译效果,满足多领域翻译需求。

  定制领域机器同传的加持可以极大地解放人力。通过对专业领域相关语料的不断学习,机器翻译结果会更智能,由于机器先天的记忆力优势,其复用性也会更高。

  此外,本次大会专业性强,很多嘉宾在演讲时经常出现中英文混合说的情况,这无疑给语音识别造成了极大的困难。基于百度领先的中英混合语音识别技术,在演讲者语速快、术语多、中英混合说的情况下,仍可以准确地识别和翻译。