国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

支持108種語言的谷歌翻譯如何用AI讓翻譯質量越來越好?

新聞 人工智能
谷歌表示,在提高語言翻譯的質量方面,已經取得了進展。在即將發表的博客文章中,該公司詳細介紹了新的創新技術。

 本文轉自雷鋒網,如需轉載請至雷鋒網官網申請授權。

谷歌表示,在提高語言翻譯的質量方面,已經取得了進展。在即將發表的博客文章中,該公司詳細介紹了新的創新技術,這些創新技術增強了Google翻譯(Google Translate)支持的108種語言(特別是數據貧乏的約魯巴語和馬拉雅拉姆語)的用戶體驗,該服務平均每天翻譯1500億個單詞。

 

[[328883]]

自谷歌翻譯首次公開亮后的13年間,諸如神經機器翻譯、基于重寫的范例和本地處理之類的技術使該平臺的翻譯準確性有了可量化的飛躍。但是直到最近,翻譯的最新算法表現也落后于人類。Google之外的努力也說明了問題的難度,Masakhane項目旨在使非洲大陸上的數千種語言能夠自動翻譯,但它還沒有超出數據收集和轉錄階段。共同的聲音(雷鋒網(公眾號:雷鋒網)注,Common Voice是Mozilla發起的一個眾包項目,旨在為語音識別軟件創建免費的數據庫)自2017年6月推出以來,Mozilla為建立轉錄語音數據的開源集合所做的努力僅審查了40種聲音。

谷歌表示,其翻譯質量的突破并不是由單一技術推動,而是針對資源較少的語言、高質量源語言、總體質量、延遲和整體推理速度的技術組合。在2019年5月至2020年5月之間,通過人工評估和BLEU(一種基于系統翻譯與人工參考翻譯之間相似性的指標)進行衡量,谷歌翻譯在所有語言中平均提高了5分或更多,在50種最低水平的翻譯中平均提高了7分或更多。此外,谷歌表示,“翻譯”對機器翻譯聯想的功能變得更加強大,一種現象是,當給泰盧固語字符“షషషషషష”輸入,“Shenzhen Shenzhen Shaw International Airport (SSH)”)時,AI模型會產生奇怪的翻譯“Sh sh sh sh sh sh sh sh sh sh sh sh sh sh sh sh sh”。

混合模型和數據挖掘器

這些技術中的第一個是翻譯模型體系結構——一種混合體系結構,包含在Lingvo(用于序列建模的TensorFlow框架)中實現的Transformer編碼器和遞歸神經網絡(RNN)解碼器。

在機器翻譯中,編碼器通常將單詞和短語編碼為內部表示,然后解碼器將其用于生成所需語言的文本。谷歌相關研究人員于2017年首次提出的基于Transformer模型在此方面比RNN更為有效,但谷歌表示其工作表明大部分質量提升僅來自于Transformer的一個組成部分:編碼器。那可能是因為雖然RNN和Transformer都被設計為處理有序的數據序列,但是Transformers并不需要按順序處理序列。換句話說,如果所討論的數據是自然語言,則Transformer無需在處理結尾之前處理句子的開頭。

盡管如此,在推理時,RNN解碼器仍比“Transformer”中的解碼器“快得多”。意識到這一點,Google Translate團隊在將RNN解碼器與Transformer編碼器結合之前對RNN解碼器進行了優化,以創建低延遲、質量更高,比四年前基于RNN的神經機器翻譯模型更穩定的混合模型進行替代。

圖:自2006年成立以來,Google翻譯模型的BLEU得分。(圖片來源:Google)

除了新穎的混合模型體系結構之外,Google還從數以百萬計的示例翻譯中(用于文章、書籍、文檔和Web搜索結果)編譯了用于編譯訓練集的數十年歷史的爬蟲。新的翻譯器基于嵌入的14種主流語言,而不是基于字典的-意味著它使用實數矢量表示單詞和短語-更加注重精度(相關數據在檢索到的數據中所占的比例)想到(實際檢索到的相關數據總量的一部分)。谷歌表示,在使用過程中,這使翻譯器提取的句子數量平均增加了29%。

有噪音的數據和轉移學習

另一個翻譯性能提升來自更好地處理訓練數據中噪聲的建模方法。觀察到有噪聲的數據(含有大量無法正確理解或解釋的大量信息的數據)會損害語言的翻譯,因此Google翻譯團隊部署了一個系統,該系統使用經過訓練的模型為示例分配分數對嘈雜的數據進行調優,并對“干凈的”數據進行調優。實際上,這些模型開始對所有數據進行訓練,然后逐步對較小和較干凈的子集進行訓練,這是AI研究社區中稱為課程學習的方法。

在資源匱乏的語言方面,Google 在翻譯中實施了反向翻譯方案,以增強并行訓練數據,該語言中的每個句子都與其翻譯配對。(機器翻譯傳統上依賴于源語言和目標語言中成對句子的語料統計)在這種方案中,訓練數據會自動與合成并行數據對齊,從而目標文本是自然語言,但會生成源通過神經翻譯模型。結果是谷歌翻譯利用了更豐富的單語文本數據來訓練模型,Google表示這對于提高流利性特別有用。

支持108種語言的谷歌翻譯如何用AI讓翻譯質量越來越好?

圖:帶有翻譯功能的Google Maps。

谷歌翻譯現在還利用了M4建模,其中一個大型模型M4在多種語言和英語之間進行翻譯。(M4是于去年在一篇論文中首次提出,證明它在訓練了100多種語言中的250億對句子對之后,提高了30多種低資源語言的翻譯質量。)M4建模使谷歌翻譯中的遷移學習成為可能,收集了包括法語、德語和西班牙語(有數十億個并行示例)的高資源語言進行訓練提升了表現,從而可以應用于翻譯諸如約魯巴語、信德語和夏威夷語(僅有數萬個示例)的低資源語言。

展望未來

根據Google的說法,自2010年以來,翻譯每年至少提高了1個BLEU點,但是自動機器翻譯絕不能解決問題。Google承認,即使是其增強的模型也容易出錯,包括將一種語言的不同方言混淆,產生過多的直譯,以及在特定題材和非正式或口頭語言上的表現不佳。

微軟試圖通過各種方式解決這一問題,包括通過其谷歌翻譯社區計劃(Google Translate Community)來招募志愿者,通過翻譯單詞和短語或檢查翻譯是否正確來幫助提高低資源語言的翻譯質量。僅在2月份,該程序與新興的機器學習技術相結合,就增加了翻譯,共有7500萬人使用了五種語言:Kinyarwanda、Odia(奧里亞語)、Tatar、Turkmen和Uyghur(維吾爾語)。

追求真正通用翻譯的并不只有Google。在2018年8月,Facebook 公開了一種AI模型,該模型結合了逐詞翻譯,語言模型和反向翻譯的組合,在語言配對方面表現更好。最近,麻省理工學院計算機科學與人工智能實驗室的研究人員提出了一種無監督的模型,即可以從未明確標記或分類的測試數據中學習的模型,該模型可以在兩種語言的文本之間進行翻譯,而無需在兩種語言之間直接進行翻譯。

谷歌在一份聲明中以外交方式表示,它對“學術界和工業界”的機器翻譯研究表示感謝,其中一些通報了自己的工作。該公司表示:“我們通過綜合和擴展各種最新進展來實現(谷歌翻譯最近的改進)。通過此更新,我們為提供相對一致的自動翻譯而感到自豪,即使是在支持的108種語言中資源最少的情況下也是如此。”

 

責任編輯:張燕妮 來源: 雷鋒網
相關推薦

2014-05-09 17:37:25

云技術云計算

2020-10-11 22:05:22

機器翻譯谷歌AI

2022-07-07 12:38:58

PlatformsMetaNLLB-200

2020-04-21 08:30:32

AI人工智能語言

2020-10-21 15:24:42

阿里AI翻譯

2019-10-12 13:36:43

機器學習人工智能計算機

2010-03-09 19:27:42

Python翻譯腳本

2024-02-06 17:57:06

Go語言任務

2013-06-07 10:41:22

微軟Bing Tansla

2021-08-03 18:00:02

ChromeEdge瀏覽器

2024-11-15 16:19:56

2024-10-21 14:56:51

2020-04-06 09:15:43

谷歌翻譯工具

2011-04-20 14:54:24

編程語言

2011-04-21 08:59:13

javascriptPythonRuby

2022-05-26 15:00:36

翻譯模型谷歌

2022-09-29 23:50:47

人工智能神經網絡平面設計

2021-06-15 05:15:30

DeepL翻譯神器應用
點贊
收藏

51CTO技術棧公眾號

91免费的视频在线播放| 日韩成人免费看| 国产精品视频久久久久| 国产欧美一区二区色老头 | a级网站在线播放| 久久亚洲成人精品| 亚洲国内自拍| 中文字幕第80页| 9191久久久久久久久久久| 老牛国内精品亚洲成av人片| 亚洲一区二区在线观| 性欧美疯狂xxxxbbbb| 亚洲青青久久| 国产午夜精品一区| 亚洲激情在线激情| 午夜不卡一区| 91香蕉视频网址| 欧美综合久久久| 国产aⅴ精品一区二区三区久久| 国产片侵犯亲女视频播放| 欧美午夜寂寞影院| 日韩高清一级| 九一国产精品视频| 精品国产免费人成在线观看| 日韩av在线播放网址| 久久精品免费网站| 国产亚洲欧美日韩精品| 久久精品日产第一区二区| 一级理论片在线观看| 51色欧美片视频在线观看| 成人av在线网站| 国产盗摄一区二区| 国产精品日韩一区二区免费视频| 亚洲视频免费在线观看| 国产精品久久久久久久久久久久久久久 | 精品国产综合区久久久久久| 一区二区三区精密机械公司| 亚洲欧美在线综合| 亚洲中文字幕无码一区二区三区 | 国产人妖伪娘一区91| 亚洲国产精品国自产拍av| 美女一区网站| 日韩欧美三级一区二区| 在线免费观看视频一区| 欧美色资源站| 亚洲一区在线不卡| www国产精品视频| 国产成人精品一区二| 丁香花在线电影| 欧美日韩一区二区视频在线| 欧美日韩国产成人在线91| 欧美在线免费| 日韩国产福利| 91久久精品日日躁夜夜躁国产| 一区二区三区久久| 国产一区99| 精品女厕厕露p撒尿| 国产精品一二区| 亚洲国产美女搞黄色| 欧洲乱码伦视频免费| 天天夜夜亚洲| 7777精品久久久大香线蕉小说| 精品久久久久国产| 欧美影视一区| 在线播放日本| 少妇特黄a一区二区三区| 亚洲国产精久久久久久久| 精品在线观看视频| 97人人做人人爽香蕉精品| 精品欧美一区免费观看α√| 欧美日韩成人在线播放| 国产精品理论在线观看| 猛男gaygay欧美视频| 最近最新中文字幕在线| 成人xxxxx色| 在线成人av网站| 免费av网站大全久久| 欧美影视资讯| 一级黄色特级片| 国产精品国语对白| 日本韩国精品一区二区在线观看| 国内精品嫩模av私拍在线观看| √天堂资源地址在线官网| 日本精品二区| 亚洲日韩中文字幕| 日本一区二区三区免费乱视频 | 亚洲精品一区二区三区蜜桃久| 亚洲色图av在线| 国产亚洲欧美色| 九九热爱视频精品视频| 亚洲成人影院少妇| 日韩av图片| 日韩一区二区福利| 亚洲蜜臀av乱码久久精品| 欧美69视频| 丰满诱人av在线播放| av观看免费在线| 国产精品天天狠天天看| 日韩一级大片在线| 久久久久久久久久久久久女国产乱| 精品日产免费二区日产免费二区| av电影在线观看一区二区三区| 亚洲一区二区三区加勒比| 欧美成人免费观看| 色综合亚洲欧洲| 狠狠狠色丁香婷婷综合久久五月| 欧美性www| 无线免费在线视频| 中文字幕黄色大片| 久久久久久成人| 欧美四级电影在线观看| 久久se精品一区二区| 久久a爱视频| 成人无遮挡免费网站视频在线观看| 99色这里只有精品| 国产综合在线观看视频| 亚洲人午夜色婷婷| 亚洲午夜在线视频| 喷水一区二区三区| 久久99国产精品视频| 国产探花在线观看| 国产美女视频黄a视频免费| 新呦u视频一区二区| 久久人人爽人人| 欧美一级电影网站| 亚洲欧洲av在线| 欧美96一区二区免费视频| 秋霞影视一区二区三区| 在线观看操人| 日日噜噜夜夜狠狠视频| 免费观看中文字幕| 国产日韩av在线| 亚洲最新av在线网站| 日韩欧美在线观看视频| 91在线一区二区| 男女精品网站| 亚洲资源网站| 成人va天堂| 秋霞a级毛片在线看| 成人精品3d动漫| 91精品一区二区三区四区| 91亚洲精品久久久久久久久久久久| 一区二区三区国产视频| 欧美色电影在线| 中文字幕一区二区三区在线不卡 | 中文在线免费一区三区| 宅男网站在线免费观看| a优女a优女片| 99久热在线精品视频| 97碰碰视频| 欧美野外猛男的大粗鳮| 亚洲偷欧美偷国内偷| 欧美精品色一区二区三区| 一区二区不卡在线播放| 26uuu久久天堂性欧美| 日本欧美大码aⅴ在线播放| 天天射成人网| 黄色免费大全亚洲| 久久精品超碰| 99riav视频在线观看| 二人午夜免费观看在线视频| 美女的尿口免费视频| 免费黄色福利视频| 日本老太婆做爰视频| 国产日韩亚洲精品| 91精品久久久久久久| 热re91久久精品国99热蜜臀| 中文字幕9999| 国产午夜精品久久久| 91麻豆精品国产91久久久久久| 午夜伦欧美伦电影理论片| 国产丝袜美腿一区二区三区| 国产精品自拍在线| 狠狠v欧美v日韩v亚洲ⅴ| 日韩电影在线免费| 久久久久久久高潮| 中文国产一区| 亚洲日本黄色| 欧美日韩伊人| 国产精品va| 国产精品av一区二区| 精品国精品国产自在久国产应用 | 日韩精品诱惑一区?区三区| 欧美一级色片| 国产精品白丝av嫩草影院| 一区二区三区无毛| 国产欧美自拍| av在线日韩| 另类专区亚洲| 美脚恋feet久草欧美| 亚洲一二三四| free欧美| 精品国产欧美日韩一区二区三区| 日本乱码一区二区三区不卡| 超碰在线97国产| 后进极品白嫩翘臀在线播放| xxxx在线视频| 人人鲁人人莫人人爱精品| 国产一区二区色噜噜| 伊人久久一区|