發布者:大(dà)尋網絡|TIME : 2016-09-28
廈門(mén)APP開(kāi)發:據外媒報道(dào),谷歌(gē)于昨日發布了網頁版和(hé)移動版的谷歌(gē)翻譯。在漢譯英的過程中,會(huì)采用全新的神經機器(qì)翻譯,而這個(gè)App每天要進行(xíng)一千八百萬次這樣的翻譯。此外,谷歌(gē)針對這個(gè)翻譯系統的運作(zuò)原理(lǐ),發表了一篇學術(shù)論文。
早前,谷歌(gē)就曾表示它們在谷歌(gē)翻譯中運用了神經網絡技(jì)術(shù),但(dàn)隻限于實時(shí)視(shì)覺翻譯這個(gè)功能。前段時(shí)間(jiān),谷歌(gē)的高(gāo)級員工Jeff Dean曾告訴VentureBeat,谷歌(gē)已經在嘗試把越來(lái)越多(duō)的深度學習功能融入到谷歌(gē)翻譯中。除此之外,谷歌(gē)的一位發言人(rén)在郵件中告訴VentureBeat,最新的神經機器(qì)翻譯是他們努力研發深度學習功能的成果。
實際上(shàng),谷歌(gē)一直以來(lái)都在緻力于将深度神經網絡融入它旗下越來(lái)越多(duō)的應用軟件中,其中包括Google Allo和(hé)Inbox by Gmail。這個(gè)功能可(kě)以幫助谷歌(gē)更快捷、更有(yǒu)效地處理(lǐ)它們的數(shù)據。
谷歌(gē)的神經機器(qì)翻譯(GNMT)對八層長的短(duǎn)時(shí)記憶遞歸神經網絡(LSTM-RNNs)依賴性很(hěn)強。“通(tōng)過層間(jiān)殘留聯系可(kě)以加強梯度流。”谷歌(gē)科學家(jiā)在論文中寫道(dào)。在圖像處理(lǐ)器(qì)的幫助下,神經網絡一旦變得(de)足夠成熟,谷歌(gē)就可(kě)以靠它尚未發布的張量處理(lǐ)單元進行(xíng)數(shù)據處理(lǐ)。
雖然神經機器(qì)翻譯并不永遠是最佳之選,但(dàn)是谷歌(gē)的各種嘗試顯示,在某些(xiē)情況下它還(hái)是有(yǒu)過人(rén)之處的。
“人(rén)們對這個(gè)翻譯系統的評價顯示,比起之前基于短(duǎn)語的翻譯系統,在翻譯多(duō)種語言時(shí),神經學習翻譯系統的錯誤率已經降低(dī)了60%,其中包括英法互譯,英西互譯以及英漢互譯。附加實驗的結果顯示,翻譯系統的質量将和(hé)筆譯人(rén)員平均水(shuǐ)準更加接近。”
在昨天發表的一篇博文中,Google Brain Team的研發科學家(jiā)Quoc Le 和(hé)Mike Schuster提到,有(yǒu)了雙語評分員的幫助,在翻譯Wikipedia上(shàng)的多(duō)語種樣句時(shí),谷歌(gē)神經機器(qì)翻譯的錯誤率實際上(shàng)已經降低(dī)了55%到85%。
盡管如此,這個(gè)系統還(hái)是不完美的。“神經機器(qì)翻譯還(hái)是會(huì)犯一些(xiē)筆譯人(rén)員永遠都不可(kě)能犯的錯誤,比如漏了一些(xiē)單詞、把一些(xiē)常見的名字或是少(shǎo)見的專有(yǒu)名詞翻錯、對文章語境缺乏整體(tǐ)把控等等。所以,我們還(hái)是有(yǒu)很(hěn)大(dà)的進步空(kōng)間(jiān)。但(dàn)不可(kě)否認的是,神經機器(qì)翻譯具有(yǒu)裏程碑意義。”(廈門(mén)APP開(kāi)發文章來(lái)自百度新聞)
聯系地址:廈門(mén)市軟件園二期望海路23号之二204|A3~A5
電(diàn)話(huà):0592-5786385
傳真:0592-5786385
QQ:413141903