国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

LLaMA-Omni:專為與大型語言模型(LLMs)進(jìn)行低延遲、高質(zhì)量的語音交互而設(shè)計(jì) 原創(chuàng) 精華

發(fā)布于 2024-10-23 19:11
瀏覽
0收藏

大型語言模型(LLMs)如GPT-4等,已經(jīng)在多個領(lǐng)域展示了其強(qiáng)大的能力,能夠通過對話幫助人們完成各種任務(wù)。然而,這些模型在需要語音輸入或輸出的場景中仍面臨顯著的限制。盡管最近的技術(shù)進(jìn)展,如GPT-4o,提升了語音交互的響應(yīng)速度,但依然存在延遲和質(zhì)量方面的挑戰(zhàn)。如何實(shí)現(xiàn)低延遲且高質(zhì)量的語音交互,成為開源社區(qū)亟待解決的問題。

01、概述 

為了實(shí)現(xiàn)與LLMs的語音交互,研究者們嘗試了多種方法,每種方法都有其局限性。最常見的做法是將自動語音識別(ASR)和文本到語音(TTS)模型串聯(lián)使用,但這種方法由于逐步處理轉(zhuǎn)錄文本、生成文本響應(yīng)和語音響應(yīng),往往導(dǎo)致較高的延遲。為了改進(jìn)這一點(diǎn),一些研究提出了多模態(tài)語音-語言模型,嘗試將語音離散化為標(biāo)記,并擴(kuò)展LLM詞匯表以支持語音輸入和輸出。雖然理論上這些模型能夠?qū)崿F(xiàn)低延遲的語音到語音生成,但實(shí)際上仍需生成中間文本以保持高質(zhì)量,從而犧牲了一部分響應(yīng)速度。

此外,還有嘗試通過在語義或聲學(xué)標(biāo)記上訓(xùn)練語言模型,或?qū)⒄Z音編碼器添加到LLMs中,以提高語音理解能力。然而,這些方法通常需要大量的數(shù)據(jù)和計(jì)算資源,或者只專注于語音理解,而忽視了生成能力。

02、LLaMA-Omni的突破性創(chuàng)新 

為了突破這些限制,中國科學(xué)院大學(xué)的研究團(tuán)隊(duì)推出了一種名為LLaMA-Omni的全新模型架構(gòu)。LLaMA-Omni的設(shè)計(jì)目標(biāo)是實(shí)現(xiàn)與LLMs的低延遲和高質(zhì)量的語音交互。其創(chuàng)新之處在于集成了語音編碼器、語音適配器、LLM和流式語音解碼器,能夠?qū)崿F(xiàn)無縫的語音到語音通信。具體來說,該模型通過直接處理語音輸入繞過了中間文本轉(zhuǎn)錄的步驟,顯著減少了響應(yīng)延遲。

LLaMA-Omni:專為與大型語言模型(LLMs)進(jìn)行低延遲、高質(zhì)量的語音交互而設(shè)計(jì) -AI.x社區(qū)

LLaMA-Omni的架構(gòu)主要包括四個部分:語音編碼器、語音適配器、LLM和語音解碼器。語音編碼器基于Whisper-large-v3,從用戶的語音輸入中提取有意義的表示。接著,這些表示經(jīng)過語音適配器處理,通過下采樣和兩層感知器映射到LLM的嵌入空間。LLM則基于Llama-3.1-8B-Instruct直接從語音指令生成文本響應(yīng)。而語音解碼器,一個非自回歸流式Transformer,利用連接時序分類(CTC)預(yù)測與語音響應(yīng)相對應(yīng)的離散單元,實(shí)現(xiàn)了文本和語音的同步生成。

LLaMA-Omni:專為與大型語言模型(LLMs)進(jìn)行低延遲、高質(zhì)量的語音交互而設(shè)計(jì) -AI.x社區(qū)


03、LLaMA-Omni的訓(xùn)練與評估

LLaMA-Omni采用了兩階段的訓(xùn)練策略。第一階段關(guān)注從語音指令生成文本響應(yīng),第二階段則專注于生成語音響應(yīng)。在推理過程中,LLaMA-Omni能夠同時生成文本和語音響應(yīng),語音解碼器在LLM生成文本的同時實(shí)時轉(zhuǎn)換為語音波形。這種方法實(shí)現(xiàn)了極低延遲的語音交互,使得用戶在文本完全生成之前即可聽到響應(yīng)。

為了支持LLaMA-Omni的開發(fā)和評估,研究人員創(chuàng)建了InstructS2S-200K數(shù)據(jù)集。該數(shù)據(jù)集包含200,000個語音指令、文本響應(yīng)和語音響應(yīng)的三元組。構(gòu)建過程包括使用Llama-3-70B-Instruct重寫文本指令以適應(yīng)語音,生成適合語音的簡潔響應(yīng),并使用CosyVoice-300M-SFT和VITS進(jìn)行語音合成。該數(shù)據(jù)集結(jié)合了Alpaca的50,000條條目和UltraChat的150,000條條目,涵蓋了廣泛的主題,為LLaMA-Omni在語音交互任務(wù)上的訓(xùn)練提供了堅(jiān)實(shí)基礎(chǔ)。

LLaMA-Omni:專為與大型語言模型(LLMs)進(jìn)行低延遲、高質(zhì)量的語音交互而設(shè)計(jì) -AI.x社區(qū)


04、未來展望 

LLaMA-Omni在InstructS2S-Eval基準(zhǔn)測試中的表現(xiàn)優(yōu)于之前的模型,特別是在語音到文本和語音到語音指令的內(nèi)容和風(fēng)格一致性上。模型在語音質(zhì)量和響應(yīng)延遲之間提供了良好的權(quán)衡,延遲低至226毫秒。與其他模型相比,LLaMA-Omni的文本和語音同時生成能力顯著提高了解碼速度。案例研究顯示,LLaMA-Omni能夠提供更簡潔、更詳細(xì)且更有幫助的響應(yīng),特別適合語音交互場景。

總之,LLaMA-Omni作為一種創(chuàng)新的AI模型架構(gòu),不僅在低延遲和高質(zhì)量的語音交互方面實(shí)現(xiàn)了突破,還通過創(chuàng)建專門的數(shù)據(jù)集和優(yōu)化訓(xùn)練過程,推動了基于LLMs的語音交互技術(shù)的發(fā)展。其卓越的性能和高效的訓(xùn)練過程,為未來的語音交互模型的快速開發(fā)奠定了基礎(chǔ)。

參考:

  1. ??https://arxiv.org/abs/2409.06666??
  2. ??https://github.com/ictnlp/LLaMA-Omni??


本文轉(zhuǎn)載自公眾號Halo咯咯  作者:基咯咯

原文鏈接:??https://mp.weixin.qq.com/s/LLMNcrcjsJ47MwsaKeXDLA??


?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請注明出處,否則將追究法律責(zé)任
已于2024-10-23 19:23:38修改
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
国产极品久久久久久久久波多结野 | 丝袜a∨在线一区二区三区不卡| 欧美男人的天堂一二区| 国产原创精品在线| 夜夜春成人影院| 亚洲免费伊人电影| 女子免费在线观看视频www| 午夜一区二区三区在线观看| 天天干夜夜干| 国产亚洲欧洲997久久综合| 欧美一区二区综合| 亚洲欧洲另类| 日本精品久久久久影院| 好吊妞视频这里有精品| 午夜精品久久久久久99热| 国产精品高潮久久| 亚洲性生活视频在线观看| 中文字幕在线直播| 疯狂欧美牲乱大交777| 日韩av一区二区三区在线| xvideos.蜜桃一区二区| 精品sm捆绑视频| 啦啦啦中文在线观看日本| 五月天激情综合| 69视频在线观看| 日韩一级二级三级精品视频| 亚洲网站视频| 日韩成人在线视频网站| 999久久久精品一区二区| 久久精品视频在线| 北条麻妃在线视频观看| 精品一区二区三区免费视频| 久久精品日产第一区二区三区精品版| 日韩成人精品一区二区| 国产suv精品一区二区| 91麻豆精品激情在线观看最新| 亚洲香蕉成视频在线观看| 8x8ⅹ拨牐拨牐拨牐在线观看| 538在线一区二区精品国产| 男人在线资源站| 欧美久久久一区| 视频免费一区| 欧美一区二区三区思思人| 日本亚洲精品| 日韩欧美国产综合在线一区二区三区| 乱人伦中文视频在线| 日本高清不卡视频| 美女羞羞视频在线观看| 制服丝袜亚洲播放| 两个人看的在线视频www| 亚洲加勒比久久88色综合| 久久电影tv| 久久九九免费视频| 欧美大胆a级| 成人综合国产精品| 性色av一区二区怡红| 久久最新免费视频| 91在线观看地址| 成人亚洲一区二区三区| 午夜视频一区在线观看| av大片在线看| 亚洲色图av在线| 亚洲网一区二区三区| 国产欧美婷婷中文| 爽好多水快深点欧美视频| 欧洲精品在线播放| 亚洲视频免费观看| 欧美激情午夜| 色噜噜狠狠狠综合曰曰曰| 欧亚精品一区| 国产无套精品一区二区| 国产精品亚洲第一| 青青草av网站| 色系网站成人免费| 亚洲黄色免费av| 98视频在线噜噜噜国产| 欧美在线观看天堂一区二区三区| 色吧亚洲视频| 国产色综合一区| 精品av中文字幕在线毛片| 亚洲欧美第一页| 国产探花一区二区| 亚洲国产精品视频一区| 国产精品久久久久影院亚瑟| 成年在线电影| 久久精品影视伊人网| 午夜电影亚洲| 免费看一级大黄情大片| 色又黄又爽网站www久久| 日韩一区精品| 国产精品啪视频| 精品一区精品二区高清| 二区视频在线| 亚洲激情第一页| 亚州精品视频| 久久免费视频2| 亚洲国产一二三| 伊人久久国产| 91在线观看免费高清| 国产高清在线精品| 神马精品久久| 最好看的2019的中文字幕视频| 热久久天天拍国产| 18黄暴禁片在线观看| 在线免费观看不卡av| 9l亚洲国产成人精品一区二三| 久久精品日韩精品| 亚洲精品国产一区二区三区四区在线| www视频在线观看| 成人免费福利在线| 久久精品视频网| 欧美xxx黑人xxx水蜜桃| 国产精品夫妻激情| 99久久久免费精品国产一区二区| 永久av在线| 国产精品久久久久久av福利软件| 国产风韵犹存在线视精品| 第九色区av在线| 欧美在线视频免费播放| 国产精品伊人色| 国家队第一季免费高清在线观看| 欧美极品少妇xxxxⅹ免费视频| 美日韩一区二区| 日本在线一二三| 午夜精品一区二区三区在线| 国产专区欧美精品| 国产原创在线观看| 成人免费视频网址| 国产精品每日更新| 韩国精品主播一区二区在线观看| 精品免费日产一区一区三区免费| 亚洲私人黄色宅男| 亚洲一区二区电影| 欧美精品自拍视频| 亚洲国产精品推荐| 久热re这里精品视频在线6| 韩日视频在线| 成人信息集中地欧美| 成人免费在线播放视频| 欧美一级网址| 99久久免费观看| 亚洲丝袜在线视频| 久久国产综合精品| jizz一区二区三区| 色综合视频二区偷拍在线| 欧美一区二区在线看| 亚洲一区二区三区高清| 日本在线视频观看| 成人自拍爱视频| 欧美日韩一二三| 中文高清一区| 性xxxxfjsxxxxx欧美| 亚洲高清视频一区| 亚洲国产一区二区三区四区| 日韩经典一区二区| 96av在线| 日本天堂免费a| 亚洲第一页在线| 免费高清不卡av| 超碰97免费在线| 久久免费看毛片| 亚洲欧美激情视频| av成人老司机| 精品亚洲自拍| 制服丝袜中文字幕在线观看| 国产一区二区色| 欧美日韩在线播放三区四区| 老鸭窝毛片一区二区三区| 男插女视频久久久| 欧美做暖暖视频| 欧美大片第1页| 亚洲夂夂婷婷色拍ww47| 欧美~级网站不卡| 性网站在线观看| 国产a级片网站| 91av福利视频| 欧美性猛交xxxx偷拍洗澡| 亚洲在线观看| 久草综合在线| 国产精品99久久99久久久| 91在线网站视频| 日韩一级成人av| 91一区二区三区在线播放| 国产成人ay| 91亚洲天堂| 男人天堂999| 国产精品偷伦视频免费观看国产| 欧美性猛交丰臀xxxxx网站| 免费看欧美女人艹b| 欧美1区2区3| 天天av综合网| 国产日产欧美一区二区| 韩国日本不卡在线| 欧美中文字幕一区二区三区亚洲| 麻豆精品视频在线观看免费| 日韩国产在线不卡视频| 麻豆app在线观看| 欧美成人免费在线观看视频| 国产女人18毛片水18精品| 欧美一区二区视频在线观看2022 |