国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

再勝OpenAI!谷歌發布20億參數通用模型,100多種語言自動識別翻譯

人工智能 新聞
近日,谷歌正式發布了支持100多個語種的20億參數通用語音模型——USM,正式對標OpenAI的開源Whisper。

上周,OpenAI發布的ChatGPT API和Whisper API,剛剛引動了一場開發者的狂歡。

3月6日,谷歌就推出了一款對標的模型——USM。不僅可以支持100多種語言,而且參數量也達到了20個億。

當然了,模型依然沒有對外開放,「這很谷歌」!

簡單來說,USM模型在涵蓋1200萬小時語音、280億個句子和300種不同語言的無標注數據集中進行了預訓練,并在較小的標注訓練集中進行了微調。

谷歌的研究人員表示,雖然用于微調的標注訓練集僅有Whisper的1/7,但USM卻有著與其相當甚至更好的性能,并且還能夠有效地適應新的語言和數據。

圖片

論文地址:https://arxiv.org/abs/2303.01037

結果顯示,USM不僅在多語種自動語音識別和語音-文本翻譯任務評測中實現了SOTA,而且還可以實際用在YouTube的字幕生成上。

目前,支持自動檢測和翻譯的語種包括,主流的英語、漢語,以及阿薩姆語這類的小語種。

最重要的是,還能用于谷歌在去年IO大會展示的未來AR眼鏡的實時翻譯。

圖片

Jeff Dean親自官宣:讓AI支持1000種語言

當微軟和谷歌就誰家擁有更好的AI聊天機器人爭論不休時,要知道,大型語言模型的用途可不僅于此。

去年11月,谷歌最先宣布了新項目「開發一種支持全球1000種最常用語言的人工智能語言模型」。

同年,Meta也發布了一個名為「No Language Left Behind」模型,并稱可以翻譯200多種語言,旨在打造「通用翻譯器」。

而最新模型的發布,谷歌將其描述為通向目標的「關鍵一步」。

在打造語言模型上,可謂群雄逐鹿。

據傳言,谷歌計劃在今年的年度 I/O 大會上展示20多款由人工智能驅動的產品。

當前,自動語音識別面臨許多挑戰:

  • 傳統的監督學習方法缺乏可擴展性

在傳統的方法中,音頻數據需要費時又費錢的手動標記,或者從有預先存在的轉錄的來源中收集,而對于缺乏廣泛代表性的語言來說,這很難找到。

  • 擴大語言覆蓋面和質量的同時,模型必須以高效的計算方式進行改進?

這就要求算法能夠使用來自不同來源的大量數據,在不需要完全重新訓練的情況下實現模型的更新,并且能夠推廣到新的語言和使用案例。

微調自監督學習

據論文介紹,USM的訓練采用了三種數據庫:未配對的音頻數據集、未配對的文本數據集、配對的ASR語料庫。

  • 未配對的音頻數據集?

包括YT-NTL-U(超1200萬小時YouTube無標簽音頻數據)和Pub-U(超429,000小時的51種語言的演講內容)

  • 未配對的文本數據集?

Web-NTL(超1140種不同語言的280億個句子)

  • 配對的ASR語料庫?

YT-SUP +和 Pub-S語料庫(超10,000小時的音頻內容和匹配文本)

圖片

USM使用標準的編碼器-解碼器結構,其中解碼器可以是CTC、RNN-T或LAS。

對于編碼器,USM使用了Conformor,或卷積增強Transformer。

訓練過程共分為三個階段。

在初始階段,使用BEST-RQ(基于BERT的隨機投影量化器的語音預訓練)進行無監督的預訓練。目標是為了優化RQ。

在下一階段,進一步訓練語音表征學習模型。

使用MOST(多目標監督預訓練)來整合來自其他文本數據的信息。

該模型引入了一個額外的編碼器模塊,以文本作為輸入,并引入了額外的層來組合語音編碼器和文本編碼器的輸出,并在未標記的語音、標記的語音和文本數據上聯合訓練模型。

最后一步便是,對ASR(自動語音識別)和AST(自動語音翻譯)任務進行微調,經過預訓練的USM模型只需少量監督數據就可以取得很好的性能。

圖片

USM整體訓練流程

USM的性能如何,谷歌對其在YouTube字幕、下游ASR任務的推廣、以及自動語音翻譯上進行了測試。

YouTube多語言字幕上的表現

受監督的YouTube數據包括73種語言,每種語言的數據時長平均不到3000個小時。盡管監督數據有限,但模型在73種語言中實現了平均不到30%的單詞錯誤率(WER),這比美國內部最先進的模型相比還要低。

此外,谷歌與超40萬小時標注數據訓練出的Whisper模型 (big-v2) 進行了比較。

在Whisper能解碼的18種語言中,其解碼錯誤率低于40%,而USM平均錯誤率僅為32.7%。

圖片

對下游ASR任務的推廣

在公開的數據集上,與Whisper相比,USM在CORAAL(非裔美國人的方言英語)、SpeechStew(英文-美國)和FLEURS(102種語言)上顯示出更低的WER,不論是否有域內訓練數據。

兩種模型在FLEURS上的差異尤為明顯。

圖片

在AST任務上的表現

在CoVoST數據集上對USM進行微調。

將數據集中的語言按資源可用性分為高、中、低三類,在每一類上計算BLEU分數(越高越好),USM在每一類中的表現的優于Whisper。

研究發現,BEST-RQ預訓練是將語音表征學習擴展到大數據集的一種有效方法。

當與MOST中的文本注入相結合時,它提高了下游語音任務的質量,在FLEURS和CoVoST 2基準上實現了最好的性能。

通過訓練輕量級剩余適配器模塊,MOST表示能夠快速適應新的域。而這些剩余適配器模塊只增加2%的參數。

圖片

谷歌稱,目前,USM支持100多種語言,到未來將擴展到1000多種語言。有了這項技術,或許對于每個人來講走到世界各地穩妥了。

甚至,未來實時翻譯谷歌AR眼鏡產品將會吸引眾多粉絲。

不過,現在這項技術的應用還是有很長的一段路要走。

畢竟在面向世界的IO大會演講中,谷歌還把阿拉伯文寫反了,引來眾多網友圍觀。

圖片

責任編輯:張燕妮 來源: 新智元
相關推薦

2023-05-25 16:24:13

2011-03-07 09:45:51

FileZilla

2019-10-12 13:36:43

機器學習人工智能計算機

2022-05-26 15:00:36

翻譯模型谷歌

2022-08-18 15:13:37

模型參數

2009-07-31 16:24:55

ibmdwEclipse

2023-03-09 06:31:14

視覺語言模型人工智能

2020-04-07 00:26:32

AI語言無監督

2011-06-01 13:49:00

Android 內存

2023-05-10 15:08:26

OpenAI語言模型人工智能

2023-05-17 10:05:56

2020-10-28 10:38:08

谷歌模型機器翻譯

2017-04-06 15:00:38

編程語言

2023-10-28 09:59:30

2022-11-01 13:52:44

AI數學

2023-04-07 09:28:31

模型訓練

2021-12-10 15:46:18

谷歌模型人工智能

2020-03-16 14:01:05

語言Java開發

2023-01-16 13:47:59

谷歌模型
點贊
收藏

51CTO技術棧公眾號

日韩精品一区第一页| 亚洲第一主播视频| 成人激情在线观看| 99在线视频影院| 国产精品不卡在线观看| 在线观看福利一区| 欧美激情偷拍自拍| 欧美成人在线网站| 国产精品迅雷| 91麻豆精品国产| 一二三在线视频社区| 欧美国产一区二区| 欧美性潮喷xxxxx免费视频看| 亚洲激情不卡| 国产精品igao视频| 哺乳一区二区三区中文视频| 日韩精品中文字幕在线播放| 免费毛片在线| 亚洲小说欧美激情另类| 国产福利在线免费| 岛国精品在线播放| 制服丝袜综合日韩欧美| 国产一区二区三区成人欧美日韩在线观看 | 亚洲国产日韩欧美| 欧美aa国产视频| 国产精品福利网站| 日本天堂一区| 97高清免费视频| 99香蕉久久| 大胆人体色综合| 在线视频成人| 久久久精品国产| 国产精区一区二区| 久久成人免费视频| 中文字幕日本一区| 久久精品99国产精品酒店日本| 经典三级一区二区| 亚洲欧洲偷拍精品| 午夜av成人| 久久精品成人欧美大片| 97久久中文字幕| 久操成人在线视频| 亚洲第一二区| 性色av一区二区三区免费| 国产一区二区三区亚洲| 2018国产精品视频| 欧美在线观看视频一区| 成人免费看片视频| 午夜久久影院| 国产一区二区三区四区五区加勒比| 亚洲天堂久久| 欧美在线视频一区二区三区| 日韩精品免费专区| 三级在线免费观看| av在线一区二区| 538任你躁在线精品免费| 亚洲女同女同女同女同女同69| 人人在线97| 欧美综合久久久| 国产在线美女| 久久精品电影网| 国产剧情在线观看一区| 99在线首页视频| 日韩高清不卡一区二区三区| 日韩精品一区在线视频| 自拍偷拍国产精品| 超碰国产在线| 亚洲精品视频播放| 成人自拍在线| 成人18视频| 久久成人精品无人区| 激情网站五月天| 欧美性xxxxxxxxx| 久草在线中文最新视频| 欧美激情手机在线视频 | 黄色网页在线看| 日韩h在线观看| 中文字幕亚洲在线观看| 成人激情视频在线播放| 久久精品国产99| mm131亚洲精品| 欧美欧美午夜aⅴ在线观看| gogo亚洲高清大胆美女人体| 日韩美女毛茸茸| 蜜臀av在线播放一区二区三区| 日韩欧美xxxx| 欧美日韩一区二区三区四区五区| 8av国产精品爽爽ⅴa在线观看| 国产成人精品电影久久久| 日本va欧美va精品| 成人毛片高清视频观看| 日韩一区二区三区视频在线观看| 成人亚洲视频| 91视频8mav| 懂色av一区二区三区蜜臀 | 国产成人自拍在线| 成本人h片动漫网站在线观看| 欧美成人精精品一区二区频| 精品国产一区二区三区成人影院| 久久综合久久综合这里只有精品| 国产女主播视频一区二区| 国产区在线观看| 热99精品里视频精品| 麻豆精品视频在线| 奇米影视888狠狠狠777不卡| 欧美成年人在线观看| 男女精品视频| 欧美xxxxxxxxx59| 色偷偷噜噜噜亚洲男人| 伊人久久亚洲美女图片| 男人艹女人在线观看| 亚洲精品美女久久| 午夜精品剧场| 开心丁香婷婷深爱五月| www.午夜精品| 美女国产一区二区| 国产毛片av在线| 欧美一区二区三区免费视| 国产精品中文字幕欧美| 在线看黄色av| 国产精品一区二区三区免费视频| 成人av在线资源网站| 亚洲wwwww| 99精品99久久久久久宅男| 亚洲天堂av老司机| 婷婷激情成人| 玖玖精品在线视频| 欧美另类z0zxhd电影| 欧美激情777| 欧美xxxx18| 久久久久久久国产精品视频| 国产精品久久7| 巨乳诱惑日韩免费av| 日韩大胆人体| 国产精品吹潮在线观看| 国产亚洲一区二区三区四区 | 日韩精品免费在线视频| 在线国产日韩| 看电影就来5566av视频在线播放| 国产精品xxxxx| 亚洲色图.com| 亚洲人成网站77777在线观看| 欧美日韩一区二区在线免费观看| 一区二区三区高清国产| 国产精品一二三四五| 欧美黄色视屏| 欧美一区2区三区4区公司二百| 日本道精品一区二区三区| 久久性感美女视频| 写真片福利在线播放| 欧日韩在线观看| 国产精品久久二区二区| 哺乳一区二区三区中文视频| 日本va中文字幕| 国内精品400部情侣激情| 国产日韩一级二级三级| 999在线精品| 午夜爽爽爽男女免费观看影院| 国内免费精品永久在线视频| 国产欧美一区二区精品性色 | 三级网站视频在在线播放| 精品伦精品一区二区三区视频| 在线免费观看日本欧美| 国精品一区二区三区| 欧美精品电影| 在线视频欧美一区| 宅男66日本亚洲欧美视频| 久久综合成人精品亚洲另类欧美| 日韩第一区第二区| 成人国产视频在线| 亚洲伊人第一页| 正在播放亚洲一区| 狠狠色狠狠色综合| av日韩一区| 国产精品666| 粉嫩av四季av绯色av第一区| 欧美日韩国产另类一区| 日本免费在线视频不卡一不卡二| 精品极品在线| 99蜜桃臀久久久欧美精品网站| 2021久久精品国产99国产精品| 午夜精品久久久久久久99樱桃| 激情偷拍久久| 丝袜诱惑一区二区| 波多野结衣家庭教师视频| 国产成人涩涩涩视频在线观看| 欧美午夜精品理论片a级按摩| 久久99久久精品| 中文字幕亚洲在线观看 | 久久综合中文字幕| 久久av免费| av大片在线播放| 少妇久久久久久被弄到高潮| 久久久久久久久久久国产| 欧美日韩免费在线观看| 欧美a级一区二区| 国产精品传媒| 秋霞午夜在线观看| 欧美私人情侣网站| 国产精品视频免费一区|