国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

小紅書開源首個大模型,11萬億非合成訓(xùn)練數(shù)據(jù)

人工智能 新聞
dots.llm1是一個1420億參數(shù)的專家混合模型(MoE),在推理過程中僅激活140億參數(shù),能保持高性能的同時大幅度降低訓(xùn)練和推理成本。

國內(nèi)著名社交平臺小紅書,開源了首個大模型——dots.llm1。

dots.llm1是一個1420億參數(shù)的專家混合模型(MoE),在推理過程中僅激活140億參數(shù),能保持高性能的同時大幅度降低訓(xùn)練和推理成本。

dots.llm1最大特色是使用了11.2萬億token的非合成高質(zhì)量訓(xùn)練數(shù)據(jù),這在現(xiàn)階段的開源大模型中非常罕見,看來小紅書也得益于自己龐大的語料庫出手就是闊啊。

所以,在中文測試中dots.llm1的性能非常強(qiáng),以91.3的平均分超過了DeepSeek開源的V2、V3和阿里開源的Qwen2.5 32B和72B。

圖片

開源地址:https://huggingface.co/rednote-hilab/dots.llm1.base/tree/main

dots.llm1架構(gòu)簡單介紹

dots.llm1使用了單向解碼器Transformer架構(gòu),但把前饋網(wǎng)絡(luò)替換為MoE。在傳統(tǒng)的Transformer架構(gòu)中,每一層的前饋網(wǎng)絡(luò)是密集連接的,這意味著每一層都會對輸入的所有標(biāo)記進(jìn)行計算。在處理大規(guī)模數(shù)據(jù)時會消耗巨大的算力。

而MoE將模型分為多個專家網(wǎng)絡(luò),每個專家網(wǎng)絡(luò)專注于輸入數(shù)據(jù)的不同方面。在推理過程中,并不激活所有的專家網(wǎng)絡(luò),而是根據(jù)輸入標(biāo)記的特性,動態(tài)地選擇一小部分專家網(wǎng)絡(luò)進(jìn)行計算。這種稀疏激活的方式極大減少了算力的需求,同時保持了模型的高性能。

圖片

dots.llm1的MoE由128個路由專家和2個共享專家組成。每個專家網(wǎng)絡(luò)是一個兩層的前饋網(wǎng)絡(luò),使用了SwiGLU激活函數(shù)。SwiGLU是一種高效的激活函數(shù),它結(jié)合了門控機(jī)制和非線性激活,能夠更好地捕捉數(shù)據(jù)中的復(fù)雜關(guān)系。

在每個輸入標(biāo)記的處理過程中,dots.llm1會通過一個路由機(jī)制選擇出6個最相關(guān)的專家網(wǎng)絡(luò),加上2個共享專家,總共激活8個專家網(wǎng)絡(luò)。這種選擇機(jī)制是動態(tài)的,會根據(jù)輸入標(biāo)記的特性來決定哪些專家網(wǎng)絡(luò)最適合處理當(dāng)前的標(biāo)記。

除了MoE模塊的設(shè)計,dots.llm1在注意力層也進(jìn)行了優(yōu)化。采用了經(jīng)典的多頭注意力機(jī)制(MHA),這是一種廣泛應(yīng)用于Transformer架構(gòu)中的注意力機(jī)制。

dots.llm1在MHA的基礎(chǔ)上引入了RMSNorm歸一化操作。RMSNorm是一種改進(jìn)的歸一化方法,通過計算輸入的均方根值來進(jìn)行歸一化,從而避免了輸入值過大或過小對模型訓(xùn)練的影響。這種歸一化操作在多頭注意力機(jī)制中尤為重要,因為注意力機(jī)制的輸出是多個頭的加權(quán)和,如果沒有適當(dāng)?shù)臍w一化,很容易出現(xiàn)數(shù)值不穩(wěn)定的情況。通過引入RMSNorm,dots.llm1能夠更好地控制注意力機(jī)制的輸出,從而提高模型的穩(wěn)定性和性能。

圖片

在MoE模塊中,dots.llm1還引入了無輔助損失的負(fù)載平衡策略。負(fù)載平衡是MoE架構(gòu)中的一個關(guān)鍵問題,因為如果專家網(wǎng)絡(luò)之間的負(fù)載不平衡,會導(dǎo)致一些專家網(wǎng)絡(luò)被過度使用,而另一些專家網(wǎng)絡(luò)則很少被激活。

這種不平衡不僅會影響模型的性能,還會降低計算效率。dots.llm1通過引入一個動態(tài)調(diào)整的偏置項來解決這個問題。偏置項會根據(jù)每個專家網(wǎng)絡(luò)的負(fù)載情況動態(tài)調(diào)整,從而確保所有專家網(wǎng)絡(luò)的負(fù)載相對平衡,不僅能夠有效地解決負(fù)載不平衡的問題,而且不會引入額外的損失函數(shù),從而避免了對模型性能的負(fù)面影響。

此外,dots.llm1在訓(xùn)練過程中還采用了AdamW優(yōu)化器進(jìn)一步提高模型的性能和效率。這是一種改進(jìn)的Adam優(yōu)化器,它通過引入權(quán)重衰減來防止模型過擬合,同時采用了梯度裁剪技術(shù),通過限制梯度的最大值來避免梯度爆炸的問題。

dots.llm1訓(xùn)練數(shù)據(jù)

數(shù)據(jù)處理是大模型訓(xùn)練的基石,dots.llm1一共使用了11.2萬億token非合成數(shù)據(jù),并構(gòu)建了一套三級數(shù)據(jù)處理流水線,從雜亂無章的原始網(wǎng)頁數(shù)據(jù)中篩選出高質(zhì)量的語料。

在第一階段的文檔準(zhǔn)備中,利用URL過濾技術(shù)屏蔽成人、賭博等有害域名,通過 trafilatura 庫精準(zhǔn)提取正文內(nèi)容,借助 fastText 語言檢測工具,將置信度 <0.65 的文檔果斷丟棄,并采用 MD5 去重方法去除重復(fù)數(shù)據(jù),同時將中英文數(shù)據(jù)比例精心控制在 1:1。

第二階段的規(guī)則處理同樣至關(guān)重要,通過行級去重,刪除前5行/后5行中出現(xiàn)超200次的重復(fù)行;利用啟發(fā)式過濾移除廣告、注冊提示等低質(zhì)內(nèi)容;借助MinHash - LSH 模糊去重,保留 Jaccard 相似度< 80%的文檔,這一系列操作剔除了約 30% 的低質(zhì)內(nèi)容。

第三階段的模型處理堪稱畫龍點睛之筆,運(yùn)用15億參數(shù)分類器精準(zhǔn)區(qū)分“文本詳情頁” 與工具 / 視頻頁面,保留高價值內(nèi)容;通過自主開發(fā)的網(wǎng)頁雜波去除模型逐行評分(0 - 1 分),過濾掉導(dǎo)航欄、邊框等無關(guān)內(nèi)容;

圖片

最后通過 200 類分類器平衡數(shù)據(jù)分布,將百科、科普等知識性內(nèi)容占比提升至 60%,大幅減少小說和產(chǎn)品描述至 15%。經(jīng)過TxT360數(shù)據(jù)集對比實驗驗證,該流水線處理后的網(wǎng)頁數(shù)據(jù)在 MMLU、TriviaQA 等基準(zhǔn)測試中表現(xiàn)優(yōu)于當(dāng)前 SOTA 開源數(shù)據(jù)。

值得一提的是,為了促進(jìn)學(xué)術(shù)研究,小紅書還開源了每1萬億token 的中間訓(xùn)練檢查點,為大模型的學(xué)習(xí)動態(tài)提供了寶貴的見解。

責(zé)任編輯:張燕妮 來源: AIGC開放社區(qū)
相關(guān)推薦

2025-06-11 14:44:48

AI文本大模型

2025-06-09 08:56:00

2025-05-14 08:51:00

2025-01-20 13:52:45

2025-09-17 14:47:51

2022-09-29 09:08:15

數(shù)據(jù)體系

2025-08-01 09:03:16

2022-08-18 09:12:17

存儲數(shù)據(jù)

2023-07-14 14:14:07

模型開源

2023-07-10 08:00:00

2024-04-01 12:43:40

模型訓(xùn)練開源

2025-04-21 09:20:00

2025-06-20 14:29:02

模型訓(xùn)練大數(shù)據(jù)

2025-08-07 16:24:19

小紅書開源dots.vlm1

2025-09-29 05:00:00

2025-08-07 02:00:00

2024-04-18 08:38:15

LLM數(shù)據(jù)訓(xùn)練模型

2015-08-06 17:19:46

大數(shù)據(jù)標(biāo)準(zhǔn)

2024-09-12 15:10:00

AI智能體

2025-11-18 10:00:56

點贊
收藏

51CTO技術(shù)棧公眾號

欧美三片在线视频观看| 中文字幕在线一区| 欧美激情精品久久久六区热门| 国产精品一区二区三区www| 麻豆视频在线| 在线视频se| 国产九九热视频| 嫩草影院中文字幕| 视频在线99| 国内精品二区| 国产综合久久久久| 2019国产精品自在线拍国产不卡| 色小说视频一区| 亚洲国模精品一区| 91精品国产色综合久久久蜜香臀| 欧美日韩国产中文字幕| 中文字幕亚洲精品在线观看| 国产成人99久久亚洲综合精品| 久久一二三四| 亚洲破处大片| 国产亚洲综合久久| 成人性生活视频免费看| 中文字幕在线看片| 日韩一区欧美二区| 亚洲成人av片| 免费毛片小视频| 精品福利网址导航| 国产精品毛片在线看| 国产丝袜在线| 国产视频网站在线| 日韩资源在线| 2020中文字幕在线播放| 成年人在线免费观看视频网站| 亚洲这里只有精品| 国产区二区三区| 午夜激情在线观看视频| 久久久噜噜噜www成人网| 欧美日韩在线视频一区二区三区| www.av片| 九色在线视频观看| 欧美成人黑人猛交| 成人在线观看黄| 亚洲高清在线免费观看| 97公开免费视频| 中文字幕 91| 快色在线观看| 李宗瑞系列合集久久| 在线免费观看你懂的| 污污软件在线观看| 成人免费视频| 中文在线字幕免费观看| 2018av在线| 欧美中文字幕精在线不卡| 偷拍视频一区二区三区| 成人全视频免费观看在线看| 精品视频一二| 欧美综合自拍| 日韩av专区| 影音先锋在线影院| 国产在线播精品第三| 91精品久久久久久久久中文字幕| 国产理论在线观看| 久久日一线二线三线suv| 国产情人节一区| 麻豆蜜桃在线| 亚洲天堂中文字幕| 老头吃奶性行交视频| 任我爽在线视频精品一| 亚洲欧洲另类精品久久综合| 一本色道久久88亚洲精品综合| 日韩视频免费播放| 亚洲娇小娇小娇小| 亚洲一区在线日韩在线深爱| 97视频在线观看网站| 久草在线视频资源| 久草综合在线| 亚欧洲精品视频在线观看| 久久99国产精一区二区三区| 亚洲国产精品综合久久久| 亚洲一区区二区| 国产69精品久久99不卡| 国产精品美女久久久久久| 香蕉加勒比综合久久| 91精品国产aⅴ一区二区| 国产午夜精品一区二区三区| 免费不卡在线观看av| 国产精品美女在线| 蜜桃传媒一区二区| 精品视频在线观看一区| 黑人巨大精品欧美一区二区奶水| 电影av一区| 波多野结衣视频一区二区| 国产亚洲亚洲国产一二区| 精品久久影院| 老司机精品视频网站| 成人国产电影网| 亚洲综合无码一区二区| 91麻豆精品国产91久久久资源速度 | 丝袜美腿玉足3d专区一区| 影音先锋成人在线电影| 98精品国产高清在线xxxx天堂| 日韩一区二区三区免费| 欧美日韩综合在线免费观看| 亚洲小说区图片区情欲小说| 久久这里只有精品视频网| 亚洲伊人成综合成人网| 久久伊人精品一区二区三区| 日本久久久久久久久久久| 狠狠色噜噜狠狠色综合久| 欧美中文字幕在线观看视频| 老司机性视频| 婷婷色在线资源| 国产成人一二| 国产精品社区| 国产视频一区在线观看| 欧美亚洲一区二区在线| 丝袜美腿精品国产二区| 91中文在线观看| 一二三四视频社区在线| 欧美女同网站| 精品福利在线| 综合激情在线| 99久久婷婷国产综合精品| 色婷婷亚洲精品| 久久精品国产亚洲精品2020| 丁香婷婷久久久综合精品国产| 欧美日韩一道本| 成人性生交大片免费看午夜| 精品视频一二| 久久精品一区| 亚洲欧美电影一区二区| 亚洲成人久久久| 国产精品美女免费视频| 免费cad大片在线观看| 日本一二三区在线视频| 亚洲精品大片| 亚洲久久成人| 亚洲欧美自拍偷拍色图| 日韩高清欧美高清| 成人精品在线视频| 国产亚洲激情视频在线| 精品国产午夜肉伦伦影院| 在线视频不卡一区二区三区| 久久久精品免费网站| 欧美黑人孕妇孕交| 欧美日韩高清一区二区不卡 | 国产精品99蜜臀久久不卡二区| 国产精品一区二区x88av| 久久影院午夜论| 91精品国产91热久久久做人人 | 日韩av免费看| 日韩最新中文字幕| 免费在线看v| 麻豆国产一区| 日本免费新一区视频 | 国产视频在线观看一区二区三区| 日韩精品一区二区三区在线观看 | 国产精品色在线观看| 欧美一区二区性| 国产欧美高清在线| 欧美自拍偷拍一区| 欧美精品 国产精品| 日本高清+成人网在线观看| 午夜久久久久久久久久久| 成人黄色免费网站在线观看| 成人免费视频一区二区| 黄污网站在线观看| 91精品中文在线| 久久综合色婷婷| 青青在线精品| 国产精品网红直播| 校园春色综合网| 香蕉521av成人网| 亚洲欧美在线磁力| 青草国产精品| 欧美 日韩 国产 高清| 欧美精品 日韩| 国产精品激情| 自拍偷拍视频在线| 色综合久久天天| 国产精品一区免费在线| 视频一区视频二区视频三区视频四区国产 | 国产亚洲精彩久久| 91九色精品视频| 国产精品911| av免费在线一区二区三区| 久久久久国产视频| 美腿丝袜亚洲一区| 国产毛片av在线| 国产精品欧美日韩久久| 97久久精品人人爽人人爽蜜臀 | 国产精品嫩模av在线| 欧美连裤袜在线视频| 中文字幕国产精品一区二区| 亚洲图片欧美| 美女精品视频一区| 国精品**一区二区三区在线蜜桃 | 电影亚洲一区| 午夜亚洲一区| 狠狠综合久久av一区二区小说|