国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

Kimi-Audio開源橫掃全場景,1300萬+小時數(shù)據(jù)煉成語音世界“大一統(tǒng)”

人工智能
昨天,kim發(fā)布了一款“萬能型”音頻大模型—?Kimi-Audio,支持語音識別(ASR)、音頻問答(AQA)、音頻字幕(AAC)、語音情感識別(SER)、聲音事件/場景分類(SEC/ASC)、文本到語音(TTS)、語音轉(zhuǎn)換(VC)和端到端語音對話。

昨天,kim發(fā)布了一款“萬能型”音頻大模型— Kimi-Audio,支持語音識別(ASR)、音頻問答(AQA)、音頻字幕(AAC)、語音情感識別(SER)、聲音事件/場景分類(SEC/ASC)、文本到語音(TTS)、語音轉(zhuǎn)換(VC)和端到端語音對話。

換句話說,它可以聽、可以說、可以理解、可以對話,支持實時語音會話,多輪交流。

圖片圖片

一套架構(gòu),橫掃音頻全場景,開源可用。

從學(xué)術(shù)和工業(yè)角度,我認(rèn)為有兩點貢獻(xiàn):

  • 模型架構(gòu)和預(yù)訓(xùn)練規(guī)??涨啊?3萬小時級別的音頻數(shù)據(jù)+大語言模型初始化,音頻和文本信號雙線處理,架構(gòu)極其“融合”。
  • 全鏈路開放+評測工具包——所有代碼、模型參數(shù)、評測工具全部開源,直接對社區(qū)開放,標(biāo)準(zhǔn)化評測徹底解決“無法復(fù)現(xiàn)”的老大難問題。

1.模型架構(gòu):語音世界的“大一統(tǒng)”

圖注:Kimi-Audio技術(shù)架構(gòu)圖注:Kimi-Audio技術(shù)架構(gòu)

Kimi-Audio的核心架構(gòu)其實就三大塊:音頻分詞器(Tokenizer)、音頻大模型(Audio LLM)以及音頻反分詞器(Detokenizer)。就像把一句話切成一個個字,音頻分詞器把聲音變成一串“音頻詞”。Kimi用的是12.5Hz采樣率(就是每秒拆12.5個“詞”),既有“離散語義詞”(理解內(nèi)容),又有“連續(xù)聲學(xué)特征”(保留音色、情感等細(xì)節(jié))。說白了,就是既能知道你說了啥,還能盡量還原你怎么說的。

音頻大模型的核心是一個“多模態(tài)大腦”,一邊能處理“音頻詞”,一邊能處理文本詞;底層結(jié)構(gòu)和流行的大模型(transformer那一套)一樣,但上面分兩頭:一頭專門“寫字”輸出文本,一頭專門“說話”輸出音頻。這個模型底子其實是個現(xiàn)成的文本大模型(Qwen2.5 7B),直接“嫁接”了音頻輸入輸出的能力,兼容性強(qiáng),省了很多訓(xùn)練資源。

音頻反分詞器就是把模型輸出的“音頻詞”重新拼成聲音?!胺謮K+流式”方案,就是把長音頻切成一小塊一小塊,每塊單獨(dú)快速合成,然后拼起來,減少延遲,體驗更絲滑。還做了“l(fā)ook-ahead”機(jī)制,就是每塊合成時偷偷看一點后面的內(nèi)容,讓拼接更自然,不斷句。

2.數(shù)據(jù)管線:1300萬+小時音頻,流水線級別的數(shù)據(jù)清洗

圖注:數(shù)據(jù)處理流程圖圖注:數(shù)據(jù)處理流程圖

Kimi-Audio這波,采用的預(yù)訓(xùn)練音頻數(shù)據(jù)高達(dá)1300萬+小時,涵蓋語音、音樂、環(huán)境聲,各種應(yīng)用場景全覆蓋。

那這么多音頻怎么處理?報告中說,Kimi團(tuán)隊搞了個自動化大流水線,從原始音頻到高質(zhì)量“帶標(biāo)注”的數(shù)據(jù),大致分幾步:

  • 語音增強(qiáng):先用AI降噪,把環(huán)境雜音、回聲處理掉。但為了不丟失真實世界的多樣性,訓(xùn)練時一半用原聲,一半用降噪后的。
  • 說話人分割(Diarization):用PyAnnote工具給每段音頻“數(shù)人頭”,誰說了哪段切清楚。還專門寫了合并/細(xì)分/優(yōu)化的后處理流程,確保每個說話段準(zhǔn)確且長度合理。
  • 轉(zhuǎn)寫+打標(biāo):用Whisper大模型自動識別英文,用FunASR的Paraformer-Zh識別中文,還根據(jù)時間戳智能加標(biāo)點,保證后續(xù)訓(xùn)練能用。

據(jù)說,除了公開數(shù)據(jù),還加了自家ASR數(shù)據(jù),音頻理解/問答數(shù)據(jù)。

圖片圖片

3.訓(xùn)練方式:任務(wù)多、策略細(xì),兼容音頻和文本智能

Kimi-Audio的訓(xùn)練分兩步:萬能預(yù)訓(xùn)練→精細(xì)指令微調(diào)。

萬能預(yù)訓(xùn)練采用音頻+文本混合學(xué),一邊學(xué)“純文本”(用MoonLight數(shù)據(jù)),一邊學(xué)“純音頻”,再加上“音頻對文本”“文本對音頻”的互轉(zhuǎn)任務(wù),最后還有“音頻-文本交錯混合”的難度提升;

精細(xì)指令微調(diào)中任務(wù)全靠“自然語言指令”分流,不用人為切換,直接靠“你說什么任務(wù),我就做什么”,且每種任務(wù)都生成多種隨機(jī)指令,訓(xùn)練時反復(fù)調(diào)換,模型抗干擾強(qiáng)。

4.各項指標(biāo)“遙遙領(lǐng)先”

Kimi-Audio與以往音頻語言模型在各類基準(zhǔn)測試上的表現(xiàn)對比Kimi-Audio與以往音頻語言模型在各類基準(zhǔn)測試上的表現(xiàn)對比

語音識別方面,LibriSpeech英文測試集,Kimi-Audio的錯誤率(WER)只有1.28%,比Qwen2.5-Omni的2.37%還低一截。AISHELL-1中文:WER 0.60%,比上一代模型低一半。此外多場景、多語種、多環(huán)境,Kimi-Audio基本都是榜首。

音頻理解方面,Kimi-Audio在MMAU、MELD、VocalSound、TUT2017等公開集上,分?jǐn)?shù)都是最高。比如MMAU的“聲音理解”類,Kimi-Audio得分73.27,超過其它競品。

音頻對話&音頻聊天方面,VoiceBench的多項任務(wù),Kimi-Audio都是第一,平均得分76.93。

語音對話表達(dá)方面,采用人類主觀打分,在速度控制、情感表達(dá)、同理心等多個維度,Kimi-Audio都能做到接近GPT-4o的效果,平均得分3.9(滿分5分)。

Kimi-Audio中用于實時語音到語音對話的生產(chǎn)部署工作流程

5.one more thing

官方也坦誠地提到,當(dāng)前Kimi-Audio音頻大模型還存在三大挑戰(zhàn):

  • “轉(zhuǎn)錄”信息有限,描述性理解還需加強(qiáng),現(xiàn)在模型對音頻的理解,大多還停留在“你說了什么”(轉(zhuǎn)寫),但很多聲音里“怎么說、什么情緒、什么場景”更重要。
  • 音頻“語義+細(xì)節(jié)”融合的表示還不夠完美:純語義Token容易丟細(xì)節(jié),純聲學(xué)Token又缺理解,如何把“內(nèi)容”和“感覺”都融在一套表達(dá)里,是下一個技術(shù)突破點。
  • 無法擺脫ASR/TTS依賴:目前大部分音頻大模型,底層還是靠ASR(語音識別)和TTS(語音合成)撐著,實際上就是在拼裝已有的技術(shù)。

論文地址:github.com/MoonshotAI/Kimi-Audio/blob/master/assets/kimia_report.pdf

模型地址:huggingface.co/moonshotai/Kimi-Audio-7B-Instruct

repo地址:github.com/MoonshotAI/Kimi-Audio

責(zé)任編輯:武曉燕 來源: 大數(shù)據(jù)文摘
相關(guān)推薦

2025-07-17 10:33:53

2025-06-09 09:50:00

VeactReact

2017-12-15 17:14:10

云端

2015-05-06 13:52:52

微軟外媒

2015-07-30 12:27:30

重郵華為

2020-12-13 13:40:22

健康碼移動應(yīng)用

2023-03-13 13:40:20

機(jī)器學(xué)習(xí)AI

2014-07-29 13:25:43

WWDC 2014 S

2023-07-17 08:03:03

Shell腳本SQL

2024-04-23 13:38:00

AI數(shù)據(jù)

2012-02-28 09:54:01

Windows 8微軟賬戶

2023-05-10 14:58:06

開源模型

2024-03-04 00:45:00

視頻訓(xùn)練

2024-03-20 09:29:41

2024-09-10 10:07:19

2025-03-13 10:18:42

2025-04-16 02:55:00

2017-06-27 10:49:48

Intel 300Wi-Fi芯片

2024-01-24 09:24:19

自動駕駛算法

2023-09-14 09:44:29

點贊
收藏

51CTO技術(shù)棧公眾號

日韩不卡视频在线观看| 亚洲免费视频播放| 国产精品一码二码三码在线| 欧美三级午夜理伦三级老人| 最新日本视频| 欧美国产亚洲精品| 99精品欧美| 成人欧美一区二区三区在线| 国产大片在线免费观看| 免费成人在线观看视频| 日韩在线观看网址| 成人毛片免费在线观看| 亚洲自拍欧美另类| 德国一级在线视频| 日韩欧美天堂| 在线播放91灌醉迷j高跟美女| 一区二区xxx| 嫩草影视亚洲| 精品高清美女精品国产区| 国产精品 欧美在线| 菠萝蜜视频在线观看www入口| 亚洲福利免费| 国产精品三级视频| 亚洲精品videossex少妇| 成人免费看片网址| 国产丝袜在线播放| 国产精品色噜噜| 国产日韩亚洲精品| 在线观看av网站| 你懂的视频一区二区| 宅男在线国产精品| 一区不卡视频| 网曝91综合精品门事件在线 | 奇米影音第四色| 国产91在线精品| 欧美v日韩v国产v| 亚洲1卡2卡3卡4卡乱码精品| 色av成人天堂桃色av| 久草福利在线| 777亚洲妇女| 色综合888| 91精品国产色综合久久不卡电影| 国产一级在线| 欧美一级专区免费大片| 一区二区精品伦理...| 亚洲国产精品va在线| 日韩欧美精品电影| 欧美中文在线视频| 久久久久97| 国产91精品久久久| 久久精品久久久| 天天综合色天天综合色hd| 国产精品久久777777毛茸茸| 99re6这里有精品热视频| 久久久久九九视频| 三级国产三级在线| 欧美男男青年gay1069videost | 日韩精品高清不卡| 亚洲欧美另类动漫| 久久精品欧美日韩| 黄色视屏免费在线观看| 欧美精品在线播放| 99久久伊人久久99| 成人亚洲性情网站www在线观看| 欧美成人sm免费视频| 国产一级久久| 免费看污黄网站| 亚洲欧洲精品一区二区三区| 亚洲一区二区精品视频| 欧美另类极品| 日韩av不卡电影| 全部av―极品视觉盛宴亚洲| 91看片在线免费观看| 精品国免费一区二区三区| 亚洲欧美日本伦理| 人人干视频在线| 精品少妇一区二区| 日韩成人伦理电影在线观看| 日本精品www| 成人中文字幕合集| 91九色精品视频| 黄色成人精品网站| 欧美国产视频在线观看| 色综合久久中文| 在线观看视频亚洲| 另类专区亚洲| 日韩一区二区av| 亚洲综合色婷婷在线观看| 一区二区三区中文在线观看| 婷婷精品在线| 国产a级黄色大片| 亚洲女人****多毛耸耸8| 黄视频免费在线看| 日韩中文在线中文网三级| 精品视频国内| 国产精品激情自拍| 天堂资源在线中文精品| 污污免费网站| 亚洲理论在线a中文字幕| 亚洲精品66| 国产91露脸中文字幕在线| 欧美精品tushy高清| 日本午夜精品视频在线观看| 高清视频在线观看一区| 亚洲欧美日韩专区| aaa在线播放视频| 亚洲一区二区在线| 欧美极品xxxx| av中文字幕一区二区| 亚乱亚乱亚洲乱妇| 白嫩少妇丰满一区二区| 狠狠躁夜夜躁人人躁婷婷91 | 日本在线成人一区二区| 亚洲国产毛片aaaaa无费看| v天堂福利视频在线观看| 国产精品www在线观看| 57pao成人永久免费视频| 97精品久久久午夜一区二区三区| 激情自拍一区| 秋霞伦理一区| 国产三级国产精品国产专区50| 亚洲精品久久久久久久久久久久久| 在线观看黄网| 人人干人人视频| 日韩av电影在线网| 国产一区二区三区站长工具| 在线观看av免费| 人人做人人爽| 污网站免费看| 亚洲性av网站| 亚洲精品一区在线观看香蕉| 免费不卡在线视频| 7777精品伊久久久大香线蕉语言| 国产精品免费99久久久| 男人天堂1024| 欧美激情在线观看视频| 久久成人人人人精品欧| 国产精品高潮呻吟久久| 影视亚洲一区二区三区| 草美女在线观看| 114国产精品久久免费观看| 亚洲成人www| 亚洲欧美日韩高清在线| 激情六月丁香| 欧洲av一区| 欧美日本啪啪无遮挡网站| 国精产品一区一区三区mba桃花 | 色鬼7777久久| 粉嫩虎白女毛片人体| 国产精品永久免费观看| 亚洲国产成人精品久久| 国产成人亚洲综合色影视| 成人亚洲综合| 超碰免费97在线观看| 成年网站在线播放| 成人免费网站在线看| 欧美另类99xxxxx| 亚洲国产日韩欧美在线动漫| 成人午夜影院| 成人h在线观看| 国产免费一区二区视频| 精品捆绑美女sm三区 | 国产福利精品av综合导导航| 欧美精品一区二区三区蜜桃视频| 一区二区三区在线免费观看| 久久国产精品99久久人人澡| 亚洲午夜一区| 国产91富婆露脸刺激对白| 欧美人妖视频| 国产欧美亚洲精品a| 91国内在线| 成年人视频免费看| 青青草免费在线视频观看| 97超级在线观看免费高清完整版电视剧| 国产91精品免费| 欧美午夜精品免费| 亚洲激情中文| 国产精品白丝jk黑袜喷水| 国产欧美激情| 精品久久综合| 网站一区二区| 蜜桃视频在线观看视频| 阿v天堂2017| 久久精品香蕉视频| 91大学生片黄在线观看| 国产一区二区三区在线观看视频| 亚洲国产精彩中文乱码av| 久久久久久99久久久精品网站| 国产日韩欧美在线一区| 国产拍揄自揄精品视频麻豆| 丝袜诱惑制服诱惑色一区在线观看 | 欧美丝袜第一区| 欧美亚洲综合网| 在线看日本不卡| 亚洲精品有码在线| 日韩中文字幕在线观看| 久久久免费观看视频| 91av在线视频观看| 成人午夜小视频| 樱空桃在线播放|