AI加持自動翻譯技術 誤譯率降低60%–口譯員要失業了嗎; 今日硅谷; 人工智慧

AI加持自動翻譯技術 誤譯率降低60%–口譯員要失業了嗎; 今日硅谷; 人工智慧


利用PC翻譯外國語言的自動翻譯技術開始有突破性發展。據日本經濟新聞(Nikkei)報導,自動翻譯導入人工智慧(AI)後,精確度大幅提升,最新的翻譯系統產品甚至包含聲音翻譯等。

不需口譯人員即可和外國人溝通的時代即將到來。由日本情報通信研究機構(NICT)所研發的「同步口譯系統」能即時對應外國人的英文語言,並在顯示器下方顯示日文字幕,宛如電影一般。待技術成熟後,可望取代口譯人員。

同時口譯系統能辨識說話者的英文口音,即時組織出對應的翻譯文句。該系統結合了辨識英語語音後撰寫英文文章的系統,以及翻譯英文文章為日文的系統。NICT尖端翻譯技術研究室室長隅田英一郎指出,根據段落文句的長度不同,同時翻譯系統的使用功效和翻譯準確度也會有所改變,期許能在5年內完成系統。

NICT早前曾和PC大廠富士通(Fujitsu)攜手,共同研發可供日本醫師和外國病患對話的多國語言聲音翻譯系統,能在平板電腦上使用。自2016年11月起開始產品實驗,當醫師詢問患者是否身體不適時,平板電腦會播放翻譯後的語音,然後再將患者的回答翻譯為日文語音。

日本電子大廠Panasonic使用NICT技術,研發外型類似大聲公的硬體產品「巨型翻譯機(Megahonyaku)」。只要使用者舉起機器說日語,就能自動轉換為英、中、韓文。往後可能利用於機場或各類活動展場。

自動翻譯的應用日益普及,且翻譯準確度在近年明確改善,例如Google在網路上提供的翻譯工具,帶給許多民眾便利。隅田說明,以往自動翻譯的準確度偏低,在網路上使用翻譯工具,往往得不到精準的結果。但目前已經大幅改進。

翻譯準確度改善的關鍵在於,近年來翻譯工具的邏輯方程式有所更換。自動翻譯技術約在60年前問世,一直以來採用的是「規則性翻譯」。由研發人員設計翻譯所需要的文法等規則,然後依照此模式翻譯。

1980年代IBM著手研發翻譯領域,推出活用大數據(Big Data)的「統計性翻譯」,在統計和整理大量的翻譯資料後,自動製作相當於翻譯規則或辭典的資料庫。這項堪稱典型AI的翻譯技術可蒐集大量資料,進而辨識翻譯文句前後順序和段落,決定適當的翻譯內容,並且持續學習。

統計性翻譯的另一特徵在於能對應多國語言。即使不明白文法和單字的意義,只要翻譯資料庫的內容充足,就能在短時間內架構出適當的翻譯模式。例如NICT免費公開的自動語音翻譯系統「VoiceTra」,已經能對應日、英、德、中、緬甸等31國語言。倘若是老舊的規則式翻譯,可能得請專家耗時多年,才有辦法確立一種語言的翻譯模式。

此外,2016年起,比統計性翻譯更上一層樓的神經網路(neural network)翻譯技術在網路上開始提供使用,如Google和微軟(Microsoft)便不約而同推出模擬大腦的神經網路,分別提供Google翻譯和微軟翻譯。

此類新技術與統計性翻譯相同,能參考大量的翻譯文句資料反覆學習,建構翻譯模式,但不會只是生硬的切換相對照的語詞進行翻譯,而是辨別上下文後,挑選恰當的詞語實行翻譯。Google表示,神經網路翻譯技術的平均錯誤率比以統計性翻譯減少60%。網路上的使用者也認為,Google翻譯的準確度有明顯提升。

日本亦有京都大學、NICT等單位著手研究神經網路翻譯技術,目前正在考慮正式導入的恰當時期。2020年東京奧運即將到來,且日本政府積極推廣觀光產業,讓日本使用外語的機會大幅增加,若自動翻譯系統能發展成熟,應能讓民眾生活更加便利。