国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

腦機(jī)接口利器,從腦波到文本,只需要一個(gè)機(jī)器翻譯模型

新聞 人工智能
加州大學(xué)舊金山分校的Joseph Makin 等人在 Nature Neuroscience上發(fā)表了一篇論文,標(biāo)題為《利用 encoder-decoder 框架,將大腦皮質(zhì)活動(dòng)翻譯為文本》(Machine translation of cortical activity to text with an encoder–decoder framework)。

[[320655]]

本文轉(zhuǎn)自雷鋒網(wǎng),如需轉(zhuǎn)載請(qǐng)至雷鋒網(wǎng)官網(wǎng)申請(qǐng)授權(quán)。

機(jī)器翻譯真的是萬(wàn)能的,不僅能夠?qū)懺?shī)、對(duì)對(duì)聯(lián)、推導(dǎo)微分方程,還能夠讀取腦波信息。

昨天,加州大學(xué)舊金山分校的Joseph Makin 等人在 Nature Neuroscience上發(fā)表了一篇論文,標(biāo)題為《利用 encoder-decoder 框架,將大腦皮質(zhì)活動(dòng)翻譯為文本》(Machine translation of cortical activity to text with an encoder–decoder framework)。

腦機(jī)接口利器,從腦波到文本,只需要一個(gè)機(jī)器翻譯模型

這篇論文的工作思路異常簡(jiǎn)單。他們將腦波到文本的轉(zhuǎn)換視為機(jī)器翻譯的過(guò)程,腦波為輸入序列,文本為輸出序列。

通過(guò)讓受試者朗讀文本,收集相應(yīng)腦區(qū)的電波,構(gòu)成訓(xùn)練數(shù)據(jù)集,然后去訓(xùn)練一個(gè)端到端的機(jī)器翻譯模型。

腦機(jī)接口利器,從腦波到文本,只需要一個(gè)機(jī)器翻譯模型

通過(guò)這種方式,他們獲得了一個(gè)模型,這個(gè)模型能夠?qū)⑹茉囌叩哪X波「準(zhǔn)確」、「實(shí)時(shí)」地轉(zhuǎn)換為句子文本,而錯(cuò)誤率僅為3%。

這種創(chuàng)新,無(wú)疑是革命性的。

目前一些用于大腦控制打字的腦機(jī)接口技術(shù),大多依賴于頭部或眼睛的殘余運(yùn)動(dòng)。以霍金為例,他可以通過(guò)手指的運(yùn)動(dòng)控制虛擬鍵盤(pán)來(lái)打出他想表達(dá)的單詞。但這種方式一分鐘最多也只能打出8個(gè)單詞。

也有一些嘗試將口頭語(yǔ)音(或嘗試發(fā)出的語(yǔ)音)解碼為文字,但迄今也僅限于對(duì)單音素或單音節(jié)的解碼,在中等大小的文本(100個(gè)單詞左右)上錯(cuò)誤率往往高達(dá)60%以上。

Joseph 等人的這項(xiàng)工作,則直接將腦波幾乎無(wú)延遲地準(zhǔn)確轉(zhuǎn)換為文本,對(duì)于癱瘓患者來(lái)說(shuō),無(wú)疑是一大福音。

總體思路

如前面所述,作者借用了自然語(yǔ)言處理領(lǐng)域的概念,在自然語(yǔ)言的機(jī)器翻譯中,是將文本從一種語(yǔ)言翻譯到另外一種語(yǔ)言。而腦波到文本,事實(shí)上也是類似的一種「翻譯」過(guò)程。

從概念上講,這兩種場(chǎng)景的目標(biāo)都是在兩種不同表示之間建立映射關(guān)系。更具體地說(shuō),在這兩種情況下,目的都是將任意長(zhǎng)度的序列轉(zhuǎn)換為任意長(zhǎng)度的另一序列。

這里需要重點(diǎn)強(qiáng)調(diào)一下「任意」,因?yàn)檩斎牒洼敵鲂蛄械拈L(zhǎng)度是變化的,并且彼此之間并不必須有確定性的一一對(duì)應(yīng)關(guān)系。在Joseph 等人的這項(xiàng)工作中,他們嘗試一次解碼一個(gè)句子,這和現(xiàn)在基于深度學(xué)習(xí)的端到端機(jī)器翻譯算法類似。兩者相同的地方是,都會(huì)映射到相同類型的輸出,即一個(gè)句子的詞序列。不同之處在于,輸入,機(jī)器翻譯的輸入是文本,而Joseph等人工作的輸入是神經(jīng)信號(hào)——受試者朗讀句子,實(shí)驗(yàn)人員用高密度腦電圖網(wǎng)格(ECoG grids)從參與者的大腦皮層處收集信號(hào)。

于是,對(duì)神經(jīng)信號(hào)稍加處理后,便可以直接用 seq2seq架構(gòu)的機(jī)器翻譯模型進(jìn)行端到端訓(xùn)練,基本不用進(jìn)行改動(dòng)。在這項(xiàng)工作中,最難的是如何獲取足夠多的訓(xùn)練數(shù)據(jù)集。我們知道,機(jī)器翻譯的數(shù)據(jù)集可以達(dá)到上百萬(wàn)規(guī)模,但這個(gè)實(shí)驗(yàn)中的每一個(gè)受試者頂多也就只能提供幾千量級(jí)的數(shù)據(jù)。在這種訓(xùn)練數(shù)據(jù)稀少的背景下,為了充分利用端到端學(xué)習(xí)的好處,作者使用了一種只包含30~50個(gè)獨(dú)立句子的受限“語(yǔ)言”。

模型

在這項(xiàng)研究中,為了收集輸入數(shù)據(jù),要求參與人員大聲朗讀句子,觀察腦波活動(dòng)。一組需要朗讀的數(shù)據(jù)是圖片描述,大概有30個(gè)句子,125個(gè)單詞,另一組采用MOCHA-TIMIT語(yǔ)料數(shù)據(jù)庫(kù)中的數(shù)據(jù),以50個(gè)句子為一組,最后一組包含60個(gè)句子。

一共有四個(gè)參與者進(jìn)行朗讀,研究人員只考慮重復(fù)朗讀三次的句子集,其中一次朗讀的數(shù)據(jù)用于測(cè)試,兩次用于訓(xùn)練。參與者在大聲朗讀的時(shí)候,會(huì)產(chǎn)生腦電波,給參與人員插上電極之后,研究人員用高密度腦電圖網(wǎng)格(ECoG grids)從參與者的大腦皮層處收集信號(hào)。

收集的腦電波信號(hào)和對(duì)應(yīng)朗讀的句子,會(huì)作為數(shù)據(jù)輸入到“編碼-解碼”架構(gòu)的人工神經(jīng)網(wǎng)絡(luò)。

腦機(jī)接口利器,從腦波到文本,只需要一個(gè)機(jī)器翻譯模型

如上圖所示,人工神經(jīng)網(wǎng)絡(luò)對(duì)輸入數(shù)據(jù)進(jìn)行處理會(huì)經(jīng)過(guò)三個(gè)階段:

1、時(shí)間卷積:一些類似的特征可能會(huì)在腦電信號(hào)數(shù)據(jù)序列的不同點(diǎn)處重現(xiàn),全連接的前饋神經(jīng)網(wǎng)絡(luò)顯然無(wú)法處理。為了有效學(xué)習(xí)這種規(guī)律,網(wǎng)絡(luò)以一定的步幅為間隔,對(duì)每個(gè)間隔應(yīng)用相同的時(shí)間濾波器(temporally brief flter)。

2、編碼器循環(huán)神經(jīng)網(wǎng)絡(luò):經(jīng)過(guò)時(shí)間卷積的處理會(huì)產(chǎn)生特征序列,把特征序列輸入到編碼器循環(huán)神經(jīng)網(wǎng)絡(luò)里面,然后,神經(jīng)網(wǎng)絡(luò)的隱藏層會(huì)提供整個(gè)序列的高維編碼,這個(gè)編碼與長(zhǎng)度無(wú)關(guān)。

3、解碼器循環(huán)神經(jīng)網(wǎng)絡(luò):在解碼階段,重點(diǎn)將是高維序列“翻譯”成一個(gè)單詞。這時(shí)的循環(huán)神經(jīng)網(wǎng)絡(luò)會(huì)進(jìn)行初始化,然后對(duì)每一步的單詞進(jìn)行預(yù)測(cè),當(dāng)預(yù)測(cè)結(jié)果是end-of-sequence token時(shí),停止解碼。作者所使用的神經(jīng)網(wǎng)絡(luò)框架如下圖所示:

腦機(jī)接口利器,從腦波到文本,只需要一個(gè)機(jī)器翻譯模型

訓(xùn)練整個(gè)網(wǎng)絡(luò)的目標(biāo)是接近MFCC(梅爾倒譜系數(shù)特征),MFCC能夠引導(dǎo)神經(jīng)網(wǎng)絡(luò)產(chǎn)生良好的序列解碼。

但是在模型測(cè)試階段,拋棄了MFCC,解碼完全依靠解碼器神經(jīng)網(wǎng)絡(luò)的輸出。在模型訓(xùn)練中,隨機(jī)梯度下降法貫穿訓(xùn)練的整個(gè)過(guò)程,所有的網(wǎng)絡(luò)層都應(yīng)用了dropout。

模型評(píng)估用錯(cuò)詞率(The Word error rate, WER)量化,WER基本想法就是把正確答案和機(jī)器的識(shí)別結(jié)果排在一起,一個(gè)詞一個(gè)詞的對(duì),把多出的詞,遺漏的詞和錯(cuò)誤識(shí)別的詞統(tǒng)統(tǒng)加在一起,算作錯(cuò)誤,然后計(jì)算錯(cuò)誤的詞占實(shí)際單詞總數(shù)的百分比。

經(jīng)過(guò)驗(yàn)證,所有參與者的平均WER為33%,對(duì)比當(dāng)前最先進(jìn)的語(yǔ)音解碼WER的60%,效果較好。

實(shí)驗(yàn)結(jié)果

作者在論文中一共進(jìn)行了兩個(gè)實(shí)驗(yàn),一個(gè)是采取了類似“控制變量”的方法,看看為何這個(gè)模型表現(xiàn)如此優(yōu)秀,另一個(gè)是通過(guò)遷移學(xué)習(xí)改善其他參與者的模型表現(xiàn)。

腦機(jī)接口利器,從腦波到文本,只需要一個(gè)機(jī)器翻譯模型

在“控制變量”實(shí)驗(yàn)中,作者重新訓(xùn)練網(wǎng)絡(luò),上圖的第二個(gè)框是采用低密度腦圖網(wǎng)格數(shù)據(jù)(lower-density ECoG grids)并進(jìn)行下采樣的性能。另外,作者只留下了1/4個(gè)通道,即只用了64個(gè)通道,而不是256個(gè)通道,此時(shí)的錯(cuò)詞率比原先高出四倍。

這意味著除了高密度腦電圖網(wǎng)格,算法也非常重要。第三個(gè)框是沒(méi)有附加MFCC時(shí)的性能,錯(cuò)誤率與低密度腦電圖網(wǎng)格類似,但優(yōu)于之前的語(yǔ)音解碼嘗試。第四個(gè)框是采用全連接網(wǎng)絡(luò)的結(jié)果,對(duì)于卷積網(wǎng)絡(luò),全連接的錯(cuò)詞率比之前高了8倍。但是在實(shí)驗(yàn)中,作者發(fā)現(xiàn),用全連接網(wǎng)絡(luò)造成的錯(cuò)詞率可以在高γ信號(hào)傳遞之前進(jìn)行下采樣解決。

腦機(jī)接口利器,從腦波到文本,只需要一個(gè)機(jī)器翻譯模型

最后,作者對(duì)重復(fù)實(shí)驗(yàn)是否影響錯(cuò)詞率進(jìn)行了量化。研究發(fā)現(xiàn),當(dāng)至少有15次重復(fù)訓(xùn)練時(shí)候,錯(cuò)詞率可以到25%以下。如上圖所示,當(dāng)訓(xùn)練次數(shù)很少的時(shí)候,參與者a和參與者b的解碼性能很差,為了解決這個(gè)問(wèn)題,作者嘗試了遷移學(xué)習(xí)。

腦機(jī)接口利器,從腦波到文本,只需要一個(gè)機(jī)器翻譯模型

上圖 a 中的第一個(gè)框用MOCHA-1數(shù)據(jù)訓(xùn)練的結(jié)果,錯(cuò)詞率為53%。考慮網(wǎng)絡(luò)第一次針對(duì)參與者b的更豐富的數(shù)據(jù)集進(jìn)行預(yù)訓(xùn)練時(shí)的性能,這種遷移學(xué)習(xí)能使錯(cuò)詞率降低約17%(上圖a中的第一個(gè)框到第二個(gè)框所示)。

作者還考慮了一種組合形式的遷移學(xué)習(xí),其中編碼器-解碼器網(wǎng)絡(luò)根據(jù)參與者b的所有MOCHA-TIMIT數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練;然后針對(duì)參與者a的所有MOCHA-TIMIT數(shù)據(jù)進(jìn)行訓(xùn)練,像往常一樣在參與者a的MOCHA-1塊上進(jìn)行測(cè)試。這種“雙重遷移學(xué)習(xí)”(圖a,第四條框)使錯(cuò)詞率比基線降低了36%,與任務(wù)遷移學(xué)習(xí)相比有所改善。

那么,改進(jìn)是否以相反的方向轉(zhuǎn)移,即從參與者a轉(zhuǎn)移到參與者b,顯然是可以的,正如上圖b所示。

對(duì)于在MOCHA-TIMIT數(shù)據(jù)上表現(xiàn)最差的參與者d,將其余的MOCHAT句子添加到訓(xùn)練集并不能改善結(jié)果(如c圖所示)。

討論

很明顯,這項(xiàng)研究最大的不足之處就是——數(shù)據(jù)集太小,僅250個(gè)單詞,30~50個(gè)句子。

若想把這種技術(shù)擴(kuò)展到通用自然語(yǔ)言上,則需要探索,到底需要多少數(shù)據(jù)才足夠,以及如何才能獲得足夠的數(shù)據(jù)。事實(shí)上,如果能夠?qū)⒛X電圖網(wǎng)格(ECoG)長(zhǎng)期插入受試者腦中,可用的訓(xùn)練數(shù)據(jù)量將比本實(shí)驗(yàn)(僅收集了半個(gè)小時(shí)的數(shù)據(jù))大幾個(gè)數(shù)量級(jí)。

在實(shí)際應(yīng)用中會(huì)遇到一些情況,有些人已經(jīng)失去了說(shuō)話能力,盡管如此,這種方法仍然可以適用,盡管性能會(huì)稍有下降。

這里,AI 科技評(píng)論還想強(qiáng)調(diào)的一點(diǎn)是:機(jī)器翻譯的本質(zhì),就是從一種信息序列映射到另一種信息序列。特別是現(xiàn)在端到端的技術(shù)下,只要能夠?qū)⒛愕膯?wèn)題換種表述方式,轉(zhuǎn)換為序列到序列的映射問(wèn)題,然后能收集到足夠多的訓(xùn)練數(shù)據(jù),那么都可以借用現(xiàn)有的機(jī)器翻譯技術(shù)來(lái)做出巨大的改變。

 

責(zé)任編輯:張燕妮 來(lái)源: 雷鋒網(wǎng)
相關(guān)推薦

2018-08-03 12:21:02

2021-04-16 09:17:39

機(jī)器學(xué)習(xí)人工智能AI

2019-10-31 10:43:05

Python 開(kāi)發(fā)編程語(yǔ)言

2020-04-27 10:37:53

機(jī)器翻譯腦機(jī)接口腦波

2023-05-15 16:00:42

AI技術(shù)

2020-07-21 08:42:16

搞垮服務(wù)器日志

2021-10-20 07:48:17

DatalistCSS技巧

2022-08-24 16:26:51

Linuxcheat 命令

2016-12-13 17:02:49

androidjava移動(dòng)應(yīng)用開(kāi)發(fā)

2017-08-21 16:00:14

機(jī)器學(xué)習(xí)機(jī)器翻譯

2017-02-16 18:40:36

2017-02-16 14:29:42

2021-06-22 18:50:00

機(jī)器翻譯人工智能計(jì)算機(jī)

2017-08-23 15:26:34

機(jī)器翻譯神經(jīng)網(wǎng)絡(luò)NMT

2024-06-13 09:05:36

2020-08-03 09:48:04

Python 機(jī)器學(xué)習(xí)代碼

2019-10-25 16:18:34

機(jī)器學(xué)習(xí)人工智能計(jì)算機(jī)

2023-08-29 13:54:00

AI技術(shù)

2018-03-07 10:03:40

2009-04-09 16:52:47

LinuxUbuntu 9.04
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

日韩精品一区在线| 国产精品久久久久久久久久久不卡 | 91精品国产综合久久香蕉的用户体验| 天堂电影一区| 欧美精品日韩精品| 国产私拍精品| 亚洲国产精品电影| 成人片免费看| 久久视频国产精品免费视频在线| 成人在线中文| 国产精品福利在线| 国产亚洲欧美日韩在线观看一区二区 | 久久99国产乱子伦精品免费| 精品乱人伦小说| 中文字幕成人一区| 欧美一级淫片| 成人网欧美在线视频| 亚洲久久在线| 亚洲一区三区电影在线观看| 日韩成人精品一区| 久久噜噜噜精品国产亚洲综合| 在线视频专区| 美女爽到高潮91| 66m—66摸成人免费视频| 欧美午夜性视频| 久久国产精品久久w女人spa| 欧美中文字幕久久| 99热这里只有精品在线播放| 一区二区三区免费看视频| 久久视频免费在线| 国产精品综合一区二区| 青青青免费在线| 国产亚洲综合性久久久影院| 欧美激情视频一区二区三区| 亚洲欧洲日本mm| 日韩一区二区福利| 成人在线直播| 亚洲人成电影网| 国产www视频在线观看| 国产精品77777竹菊影视小说| 久久久久久免费看| 日韩电影精品| 一区二区三区高清不卡| www.com黄色片| 91麻豆精品国产91久久久更新资源速度超快| 黄色一区二区在线观看| 六月丁香激情网| 日韩二区三区四区| 4p变态网欧美系列| 欧美日韩国产探花| 99热久久这里只有精品| 欧美综合色免费| 97精品国产97久久久久久| 久久蜜桃av一区二区天堂| av 日韩 人妻 黑人 综合 无码| 91色视频在线| 欧美久久一区二区三区| 亚洲va电影大全| 欧美美女黄色| 色综久久综合桃花网| 黄色在线网站噜噜噜| 色综合天天综合网天天狠天天| 三级黄色的网站| 国产精品资源在线观看| 激情视频一区二区| 日精品一区二区| 国产亚洲情侣一区二区无| 日本天堂一区| 亚洲欧美电影在线观看| 亚洲老妇xxxxxx| 白嫩亚洲一区二区三区| 综合视频免费看| 精品对白一区国产伦| 国产精品日韩| 欧美色视频免费| 成人性生交大片免费看视频直播| 国产视频不卡一区| 欧美不卡在线观看| 日韩一级片播放| 久久久久久18| 国产精品久久久久久亚洲毛片| 午夜影院一区| 欧美成人剧情片在线观看| 日韩中文视频| 欧美高清视频在线观看| 经典三级一区二区| 在线亚洲欧美视频| 欧美精品国产白浆久久久久| 成人毛片视频在线观看| 国产极品粉嫩福利姬萌白酱| 136国产福利精品导航| 欧美aaa大片| 欧洲中文字幕国产精品| 欧美在线免费观看亚洲| 欧美变态网站| 国产精品第3页| 夜夜精品视频| 国产精品999视频| 韩曰欧美视频免费观看| 色悠久久久久综合先锋影音下载| 97netav| 中文字幕一区二区三区乱码在线 | 黄色春季福利在线看| 亚洲精品日韩专区silk| 成人高潮成人免费观看| 日本一区二区三区免费观看| 日韩电视剧免费观看网站| 秋霞电影一区二区| 一区二区小说| 欧美大胆a人体大胆做受| 丁香六月婷婷| 一本一生久久a久久精品综合蜜| 97视频在线观看网址| 亚洲第一区第一页| 蜜桃一区二区三区四区| 色呦呦在线视频| 中文字幕剧情在线观看一区| 精品国产一区二区三区四区在线观看| 高清不卡一区二区| 久9re热视频这里只有精品| 污视频在线观看网站| 中文字幕精品在线播放| 国产亚洲自拍偷拍| 欧美综合在线第二页| 久久夜精品va视频免费观看| 婷婷成人激情在线网| 青青草精品视频| 日韩视频中文| 国产精品久久久久久久久久10秀| 久久久国产精品网站| 色呦呦在线免费观看| 蜜桃视频在线播放| 国产精品视频中文字幕| 97netav| 国产高清精品一区二区| 97超级碰碰碰久久久| 日韩黄色高清视频| 精品免费一区二区三区| 色噜噜狠狠一区二区三区果冻| 韩日欧美一区二区三区| 一本久久青青| 17videosex性欧美| 男人j桶女人的网站| 免费av播放| 丁香视频免费观看| 日本特黄a级高清免费大片| 91网在线观看| 69久久夜色| 9765激情中文在线| 毛片在线视频| 丝袜中文在线| 99久久999| 日韩精品一卡| 久久国产一二区| 蜜桃av综合| 不卡视频一二三| 亚洲图片自拍偷拍| 精品久久久久久国产| 美女视频一区在线观看| 校园春色亚洲色图| 日韩精品一区二区三区中文字幕| 国产精品美女www爽爽爽视频| 国产精品旅馆在线| 日韩av在线电影观看| 凹凸国产熟女精品视频| 色综合手机在线| aaa在线观看| 日本天堂影院在线视频| 日本美女高清在线观看免费| 亚洲精品aaa| 国产探花一区二区| 欧美一性一交| 日韩国产在线一| 青青草原综合久久大伊人精品优势| 成人h动漫精品| 日韩欧美一级精品久久| 国产午夜精品麻豆| 精品国产乱码久久久久久蜜柚 | 欧美亚洲激情视频| 鲁鲁狠狠狠7777一区二区| 最新av番号| av成人资源| 亚洲日本成人| 国内精品国产三级国产a久久| 亚洲国产综合在线| 国产午夜精品麻豆| 国产一区视频在线播放| koreanbj精品视频一区| 美女网站在线| 国产中文精品久高清在线不| av电影在线观看完整版一区二区| 国产乱淫av一区二区三区| 中文字幕在线视频一区| 精品99一区二区| 91久久精品美女高潮| 欧美一区二区视频17c| 国产精品ⅴa有声小说| 97国产精品视频人人做人人爱| 欧美激情精品在线| 精品无人区一区二区三区|