技術升級 Google機器人說話 媲美真人

技術升級 Google機器人說話 媲美真人


Google人工智慧(AI)技術再進化,該公司宣布能讓機器人說話語調不再怪異、不自然,聽來幾乎和人類一模一樣。

Technews報導,Google部落格宣稱,開發出第二代文字轉語音系統「Tacotron 2」,機器會依據語意學決定正確發音,文章略有拼寫錯誤也能順利讀出,就連繞口令都難不倒。不過Google表示,Tacotron 2無法讀出部分難字,沒有情緒,不能傳達快樂或悲傷的感覺,仍有許多地方需要改進。

Tacotron 2包括兩個深度類神經網路,第一個網路會把文字轉成聲譜圖,用圖像表達音頻,接著把聲譜圖輸入WaveNet系統中,機器會照圖發出相應聲音。

目前Google虛擬語音助理已用WaveNet技術發聲,若能進一步採用Tacotron 2,可讓Google助理如虎添翼。

報導指出,Google母公司Alphabet旗下的DeepMind研發出新技術,能讓電腦合成語音和人類聲音的差距減少一半。DeepMind的「WaveNet」技術能分析原始聲波,使用類神經網路修正。此種技術需要龐大的運算能力,每秒要1.6萬個範本才能轉成數據、合成為語音。

Google人員表示,外界認為Tacotron 2表現類似專業人員。民眾給Tacotron 2的平均意見分數是4.53分,只略低於專業人員錄製聲音的4.58分。

来源:世界日报