新疆都市报 > 教育 > 考试 >

挑戰CET6翻譯考試的機器翻譯系統

发布时间:2019-06-16 14:32来源: 网络整理

原標題:挑戰CET6翻譯考試的機器翻譯系統

  日前,合肥師范學院舉辦了一場特殊的考試。說它特殊,是因為“考生”隻有一個,而且是一套機器翻譯系統。考題來自三天前剛結束的大學英語六級(CET6)考試,評分的是兩位具有六級閱卷經驗的高校資深專家。“考生”一口氣做了三道翻譯題,每道題滿分15分,它得到13分的均分,每題用時隻有5秒。“這套機器翻譯系統的表現讓我們驚喜,翻譯得很地道。”對於成績,專家的鑒定是:優秀!

  看似普通的系統背后,是機器翻譯領域近一個世紀的技術積累,也包含著科大訊飛創新實現的領域翻譯技術突破以及最新推出的行業翻譯解決方案。

  大學英語六級翻譯測試共有三道考題。按規定,考生們隻需作答一題,時間是半小時。

  詞匯量是第一需要具備的,目前六級詞匯量要求達到6000個,其中不乏生僻詞匯和短語﹔由於漢英間表達習慣的不同,邏輯、語序調整也十分重要。

  科大訊飛團隊12月14日就將機器和系統封存在公証處,“此舉旨在確保在斷網和無人工干預的情況下測評。”科大訊飛負責機器翻譯的研發人員說。12月18日,在公証人員的見証下,考官分別打開三道考題,由人工輸入電腦后系統作答,不到5秒便導出了文本。

  成績令人驚喜:每道題取三位評分專家的平均分,再計算三道題的平均分,最終機器翻譯系統拿下13分。參考往年大學英語六級翻譯考題的表現,可達到優秀六級考生的水平。

  現場兩位評分專家來自上海交通大學外語學院,“這套系統翻譯出來的語言質量很高、語法也很地道,表現好過預期。”她們給出的評價稱:機器翻譯能准確表達原文意思、譯文流暢、結構清晰,可以較好地輔助不同語言的信息溝通。

  “到目前為止,機器翻譯到底達到了什麼樣的水平,還沒有人能夠給出明確答案。”科大訊飛負責機器翻譯的研發人員說。

  據了解,科大訊飛自2012年啟動機器翻譯的研發工作,目前很多技術已達到世界領先水平。2014年,在IWSLT口譯翻譯比賽上就取得了中英互譯的第一名﹔2015年NIST國際openMT機器翻譯比賽,中英人工主觀分獲得冠軍﹔剛剛過去的2018年IWSLT比賽,在端到端的語音翻譯上再次以顯著優勢取得第一名。

  “但機器翻譯還是很難,主要是其處理的對象——自然語言存在復雜性。”研發人員介紹,自然語言是人類在社會生活中,通過不斷的重復性使用而自然進化形成的溝通媒介(語言),並且在此過程中缺少規劃和設計,使得語言本身就存在諸多不確定性,“同樣一句話,在不同的語境中不同人就有不同的理解”。

  機器翻譯系統何以在大學英語翻譯權威評測中獲得好成績?

  “一是核心算法,二是大規模語料庫,三是高性能計算平台。”研究人員介紹,機器翻譯技術是利用計算機把一種自然語言翻譯成另一種自然語言,從1933年正式被提出開始,目前已發展有三代技術、取得了長足的進步。

  “最新一代技術是基於端到端的神經機器翻譯。”神經機器翻譯算法的提出,是當前機器翻譯取得重大突破的關鍵。但想拿到高分,少不了“獨門秘籍”。

  “六級翻譯題涉及文化、經濟、歷史、社會等多領域,還有不少專業表達或中國特色詞匯,在整個翻譯系統可供訓練的語料中是比較匱乏的。”科大訊飛為了破解這一難題,對神經機器翻譯進行若干改進,其中一項重要改進是領域翻譯技術,即在通用翻譯模型之上進行了領域定制。

  “翻譯中常會遇到行業術語,有的機器可能沒有見過、有的見過卻在不同行業有不同翻譯方式。”科大訊飛給出的解決方案是:提前將行業領域的關鍵詞匯融入翻譯模型,指導機器在平日訓練中自動學習術語,從而在翻譯過程中產生正確的譯文。

  早在2016年,科大訊飛就發布了訊飛翻譯機產品,並在業界第一個推出了純離線的神經網絡的離線口語翻譯系統。而今,訊飛翻譯機的用戶遍及全球170個國家。

  未來,有了最新的翻譯技術,它們會有什麼改變?

  在某跨國醫療技術峰會現場,你可以拿出最新升級的訊飛翻譯機2.0,和與會外賓專家暢聊。從“口袋裡的翻譯官”升級為“行業翻譯官”,這台小機器在通用翻譯模式下新增行業翻譯模式,正是使用了該技術﹔除了金融,在醫療、計算機等行業專業場景下都可以實現中文與英文的及時互譯。

  讓人類更便捷的交流、更輕鬆的工作,機器翻譯技術的發展也正在實現著用人工智能建設美好世界的願景。

   (本報記者 常河 本報通訊員 張沛)


(責編:郝孟佳、曹昆)