国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

最強32B中文推理大模型易主:開源免費商用,1/20 DeepSeek-R1參數量SOTA,權重代碼數據集全開源

人工智能 新聞
作為國內最早All in AIGC賽道的先行者之一,昆侖萬維自2023年起便構建了全方位的前沿布局:從基礎大模型到垂直應用,從技術研發到生態建設。尤其值得注意的是,昆侖萬維持續為開發者社區提供高質量的模型和工具鏈,這種堅持普惠的技術理念也為其提供了獨特競爭力。

千億參數內最強推理大模型,剛剛易主了。

32B——DeepSeek-R1的1/20參數量;免費商用;且全面開源——模型權重、訓練數據集和完整訓練代碼,都開源了

這就是剛剛亮相的Skywork-OR1 (Open Reasoner 1)系列模型——

通用32B尺寸(Skywork-OR1-32B)完全超越同規模阿里QwQ-32B;代碼生成媲美DeepSeek-R1,但性價比更高。

圖片

△Skywork-OR1-32B-Preview

數學推理方面:7B、32B都達到同規模最優,數學專項模型(Skywork-OR1-Math-7B)表現更突出。

圖片

Skywork,天工是也,來自AIGC巨頭玩家昆侖萬維。

Skywork-OR1系列模型現已全面開源,模型權重、訓練數據集和完整訓練代碼,所有資源均已上傳至GitHub和Huggingface平臺。配套的技術博客已發布于Notion平臺,詳細闡述了數據處理流程、訓練方法和關鍵技術發現,為社區提供了完全可復現的實踐參考。

目前Skywork-OR1-7B和Skywork-OR1-32B的能力還在持續提升,在兩周內會發布兩個模型的正式版本,同時也會推出更為系統詳盡的技術報告,分享推理模型訓練中的經驗與洞察。

3款模型全量開源

Skywork-OR1 (Open Reasoner 1) 系列開源共有3款模型:

  • Skywork-OR1-Math-7B:專注數學領域的專項模型,同時也具有較強的代碼能力。
  • Skywork-OR1-7B-Preview:融合數學與代碼能力,兼顧通用與專業性
  • Skywork-OR1-32B-Preview:面向高復雜度任務、具備更強推理能力的旗艦版本

團隊對比了Skywork-OR1系列在AIME24、AIME25、LiveCodeBench上的表現。

AIME24/25是美國數學邀請賽基準測試,LiveCodeBench主要評估大語言模型代碼生成和編程能力。

在評測方面,Skywork-OR1系列模型引入avg@k作為核心評估指標,用于衡量模型在進行k次嘗試時成功解決問題的平均表現

傳統的pass@k指標僅關注“至少一次成功”,相對而言avg@k更關注模型的穩定性和整體推理能力,為模型實際落地提供更全面真實的參考。

圖片

在數學方面,通用模型Skywork-OR1-7B-PreviewSkywork-OR1-32B-Preview在AIME24與AIME25數據集上均實現了同參數規模下最優表現,32B整體表現基本與DeepSeek-R1齊平。

編程方面,通用模型Skywork-OR1-7B-Preview與Skywork-OR1-32B-Preview在LiveCodeBench上均取得了同等參數規模下的最優性能。

整體而言,Skywork-OR1-32B-Preview甚至與DeepSeek-R1的差距非常微小。要知道后者的參數規模是前者的20倍,這意味著Skywork-OR1能帶來更具性價比的性能表現。

由此綜合來看,Skywork-OR1-32B-Preview成為當前同規模最強中文推理模型,也是現役支持免費商用的模型中最強且最具性價比的成員之一。

此外,數學專項模型Skywork-OR1-Math-7B在AIME24/25的表現遠超當前主流7B級模型,甚至接近蒸餾版Deepseek-32B模型同等水平(DeepSeek-R1-Distill-Qwen-32B)。

如下為該模型在AIME24上的訓練準確率曲線。圖片

最終模型在AIME24和AIME25上分別達到69.8%和52.3%,超越了OpenAI-o3-mini (low),達到了當前尺寸SOTA性能。與此同時,該專項模型在代碼領域也表現出了較好的泛化性(訓練后,Livecodebench從37.6%提升到43.6%)。

圖片

OpenAI-o3-mini(low)的AIME24分數來自官網,AIME25分數來自評測網站https://matharena.ai/

去年11月,昆侖萬維發布國內首款中文復雜推理模型Skywork-o1,Skywork-OR1系列模型正是在此基礎上迭代而來。

不同于簡單復刻OpenAI o1模型,Skywork-o1內生出了思考、計劃、反思等能力。它共包括三款模型Skywork-o1-Open、SI’m kywork-o1-Lite和Skywork-o1-Preview,分別適用于不同的應用場景,可以滿足開源到高性能推理的多樣化需求。

Skywork-OR1系列站在Skywork-o1的肩膀上有了更強基座,但想要如此強大,也離不開一系列先進技術加持。

背后秘訣:AGI技術洞藏,訓練效率提升50%

Skywork-OR1在數據處理、訓練策略等方面都做了進一步創新。

首先在數據方面。

為提升模型在數學和代碼方面能力,Skywork-OR1構建了一個高質量數學和代碼數據集。

團隊設計了三個標準進行數據篩選:可驗證性(Verifiable)、正確性(Correct)與挑戰性(Challenging),剔除無法自動驗證的證明類題目、有誤題目、和缺少unit test的代碼問題。

數學領域共計收集11萬道題目,主要依賴NuminaMath-1.5(含約89.6萬題),選用如AIME和Olympiads等較難子集,并補充了如DeepScaleR、Omni-MATH、AIME 1983-2023難題來源。

代碼領域收集了13.7k條高質量代碼問題,主要以LeetCode和TACO數據為主,保留了單元測試完整、驗證通過的問題,并進行向量級語義去重。

在數據過濾部分,團隊對每道題進行了多輪采樣并驗證答案,以避免“全對”或“全錯”現象對策略學習無效——模型生成全部錯誤,無法提供有效的學習信號;“全對”意味著模型已完全掌握,繼續學習會浪費計算資源。

并通過人類審核結合LLM自動判題機制,對語義不清、信息不全、格式錯誤或含有無關內容的項目進行清理。使用LLM-as-a-Judge剔除掉約1-2K道質量不達標的數學題。

其次在強化學習部分,Skywork-OR1使用GRPO(Group Relative Policy Optimization)進行訓練,并引入一系列優化策略。

在訓練時數據優化上,一方面采用雙重過濾策略:

  • 離線過濾:訓練前使用待訓練模型評估數據,剔除正確率為0或1的樣本;
  • 在線過濾:每個epoch動態移除上一輪已完全掌握的數據,確保模型持續面對有挑戰性的內容。

另一方面使用拒絕采樣(Rejection Sampling)進行更精細的實時篩選,在每個訓練步驟中動態剔除當前訓練步中采樣正確率為0或1的樣本。這樣可以維持policy loss、entropy loss和KL loss的合理比例,防止非policy loss比重異常增加導致的訓練不穩定。

在訓練Pipeline優化上主要做了兩方面的探索。

(1)多階段訓練(Multi Stage Training):從小窗口開始,逐步增加上下文長度(seq_len),可以促使模型在有限token內高效完成任務;隨后逐步擴展窗口大小,迭代增加生成長度,使模型逐漸掌握更復雜的長鏈思維能力。實驗證明,多階段訓練能顯著縮短訓練時間,同時完全保持模型的長度擴展能力。

(2)截斷優勢掩碼(Truncated Advantage Mask):在多階段訓練初期,由于上下文窗口限制,復雜問題的回答可能被截斷。因此團隊研究了兩種處理窗口限制下截斷樣本的策略Adv-Mask Before(計算優勢前排除截斷樣本)和Adv-Mask After(計算后將截斷樣本優勢置零)。證明即使不屏蔽截斷樣本,模型也能有效適應并迅速提升性能,也證明多階段訓練框架的魯棒性。

此外,在強化學習訓練中還要保障模型的探索能力。

團隊進行了三方面探索。

第一,高溫度采樣。采用τ=1.0(高于常見的0.6)維持更高群組內多樣性,既保證足夠正確樣本提供學習信號,又允許模型探索更廣泛解決路徑。

第二,提升內在訓練多樣性。通過精細數據過濾、增加批量大小和減少數據重復使用,可以從源頭上防止模型過早優化到單一輸出方向,同時也保持較高熵值,避免局部最優。

第三,自適應熵控制。只有在熵值低于閾值時才提供熵增加鼓勵,設定目標熵值并動態調整損失系數,同時最小化對正常訓練軌跡的干擾。

最后在保障強化學習訓練的穩定性,團隊對損失函數進行優化。

第一,移除KL損失。研究中發現即使基于高質量SFT模型訓練,KL損失仍限制性能提升。因此,除特定階段外,團隊在所有公開發布的Skywork-OR1系列模型中均未使用KL損失項,這使模型能夠更充分地探索和優化推理能力。

第二,token級策略損失。移除了策略損失中的長度歸一化項,并將損失在訓練批次內的所有token上進行平均,以提升優化過程的一致性與穩定性。

(更多技術細節和實驗對比可以參照技術博客https://capricious-hydrogen-41c.notion.site/Skywork-Open-Reaonser-Series-1d0bc9ae823a80459b46c149e4f51680,或繼續關注后續發布的技術報告。)

在此訓練策略下,Skywork-OR1-7B和Skywork-OR1-32B-Preview通用推理模型仍處于持續提升狀態,本次開源是當前訓練過程中性能最佳的checkpoint。

預計兩周后,具備更全面能力提升及更強大推理能力的Skywork-OR1正式版本將與大家見面,同樣全面開源。

Hugging Face單月下載量超7萬

自2023年以來,在全面擁抱AIGC后,昆侖萬維一直堅持開源,推動技術平權。代表性動作包括:

  • 2023年:開源百億級大語言模型Skywork-13B系列及600GB高質量數據集。
  • 2024年:陸續開源數字智能體研發工具包AgentStudio、4000億參數MoE超級模型、Skywork-MoE、 Skywork-RM/PRM,Skywork-o1。

今年以來,開源的頻率變得更高。第一季度開源動作包括:

  • 面向AI短劇生成的視頻生成模型SkyReels-V1:下載量周榜前十
  • R1V視覺思維鏈推理模型:單月下載8.75k
  • Skywork-OR1新系列:長思維鏈推理模型。

不難發現,昆侖萬維開源全面且徹底,同時兼顧產業需求。

一方面,它的基礎模型布局非常全面,覆蓋AIGC全領域,文生文、文生視頻、文生音樂等。

另一方面,這些模型從底層設計上即考慮了實際落地的需求。提供更高性價比、更節省算力,如SkyReels-V1則是看到了垂直領域的落地前景,模型下載量迅速增長也驗證了這一市場需求。

最關鍵的是,這些模型的開源程度也相當徹底,十分利于開發者使用。

在Hugging Face上,昆侖萬維開源模型的下載量相當可觀,累計上月下載量超過7萬。

圖片

△部分展示

如今,底層模型競爭日趨白熱化,全球AI領域正以驚人的速度迭代演進,幾乎每個月都有值得關注的模型發布,這種創新密度前所未有。

作為國內最早All in AIGC賽道的先行者之一,昆侖萬維自2023年起便構建了全方位的前沿布局:從基礎大模型到垂直應用,從技術研發到生態建設。尤其值得注意的是,昆侖萬維持續為開發者社區提供高質量的模型和工具鏈,這種堅持普惠的技術理念也為其提供了獨特競爭力。

當前,開源生態正展現出前所未有的活力。

這些開源創新正快速滲透到互聯網、制造業、醫療、教育等領域,推動著AI技術真正實現規模化落地。在這一進程中,以昆侖萬維為代表的開源踐行者的每一步探索,都將深刻影響AI產業的發展軌跡。

據說Skywork-OR1正式版,也已經快馬加鞭,即將對外發布。

Skywork開源系列(2025)傳送門:

1、中文推理模型Skywork-OR1:

https://github.com/SkyworkAI/Skywork-o1

2、視覺思維鏈推理模型Skywork-R1V:

https://github.com/SkyworkAI/Skywork-R1V

3、AI短劇生成模型SkyReels-V1:

https://github.com/SkyworkAI/SkyReels-V1

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-06-12 09:48:27

2025-03-06 17:29:21

2025-03-10 07:00:00

阿里開源QwQ-32B

2025-02-03 14:17:27

2025-03-12 13:55:05

2025-03-27 10:28:32

2025-04-11 14:54:44

2025-09-08 09:06:16

2025-03-05 03:00:00

DeepSeek大模型調優

2025-02-14 09:20:00

模型數據訓練

2025-02-12 12:45:59

2025-03-07 08:30:00

2025-02-13 08:51:23

DeepSeek大模型

2023-05-29 13:53:46

開源模型

2025-03-13 08:13:47

DeepSeekMLLMVision-R1

2025-07-18 09:55:11

2025-05-19 08:41:00

AI模型開發者

2024-04-10 08:15:17

模型語言模型GPT
點贊
收藏

51CTO技術棧公眾號

色婷婷精品久久二区二区蜜臀av| 麻豆亚洲精品| 色综合视频在线观看| 高清无码视频直接看| 校花撩起jk露出白色内裤国产精品| 亚洲成av人片| 91黄色小网站| 亚洲午夜电影| 网红女主播少妇精品视频| 国产欧美日韩亚州综合| 丰满放荡岳乱妇91ww| 91禁外国网站| 18aaaa精品欧美大片h| 一级日本不卡的影视| 亚洲日本电影在线| 日韩精品一区二区在线| 一级片a一级片| 国产白丝精品91爽爽久久 | 国产一区91精品张津瑜| 91嫩草在线视频| 日韩高清在线观看一区二区| 亚洲激情在线观看视频免费| 国产二区视频在线观看| 亚洲午夜一区二区三区| 四虎影视av| 中文字幕 久热精品 视频在线| 99久久久无码国产精品性色戒| 国产日韩精品视频一区二区三区 | 奇米亚洲午夜久久精品| 97视频热人人精品| 日韩在线高清| 国产精品久久久久久久9999| 51社区在线成人免费视频| www.国产精品一二区| 超碰超碰人人人人精品| 亚洲精品国产精品国自产观看浪潮| sese一区| 欧美日韩和欧美的一区二区| 男人天堂综合| 欧美性精品220| 四虎精品在线| 欧美日韩国产精品| 神马亚洲视频| 91成人看片片| 3d成人动漫在线| 91精品一区二区三区久久久久久| 精品资源在线看| 欧美三级韩国三级日本三斤 | 国产成人精品亚洲日本在线桃色| 日韩jizzz| 老牛国产精品一区的观看方式| 欧美精品欧美精品| 日韩高清在线观看| 国产精品美女在线播放| 国产99久久久国产精品免费看| 男人的天堂avav| 久久欧美一区二区| 被下部羞羞漫画| 欧美色道久久88综合亚洲精品| 一本一道dvd在线观看免费视频| 欧美日韩在线视频一区二区| www.中文字幕久久久| 精品久久久久久综合日本欧美| 欧美三级网址| 国内精品久久久久久久久| 日韩理论电影中文字幕| 国产精品自拍小视频| 很黄很黄激情成人| 亚洲成人a**址| 成人app下载| 91大神影片| 欧美午夜免费电影| 不卡专区在线| 欧美极品欧美精品欧美视频| 欧美偷拍自拍| 欧美日韩在线观看一区二区三区| 国产suv精品一区二区6| 综合激情丁香| 在线视频欧美精品| 欧美激情喷水| 欧美专区在线观看| 99国产精品自拍| 久久久久久久中文| 亚洲va国产va欧美va观看| 羞羞视频在线观看免费| 久久精品国产精品亚洲| 久久中文字幕av| 做爰高潮hd色即是空| 1000精品久久久久久久久| 欧美成年黄网站色视频| 久久激情视频久久| 香蕉av一区二区| 四虎精品欧美一区二区免费| 一个色妞综合视频在线观看| 特级毛片在线| 日韩av黄色在线观看| 美洲天堂一区二卡三卡四卡视频| 色悠悠久久综合网| 日韩亚洲电影在线| 日本一区福利在线| 欧洲美女精品免费观看视频 | 国产伦精品一区二区三区视频黑人| 奇米色一区二区三区四区| 一本久道高清无码视频| 午夜影院久久久| 在线观看精品| 91亚洲一区精品| 成人aa视频在线观看| 爱久久·www| 欧美国产第一页| 日本免费在线视频不卡一不卡二| 国产福利电影在线观看| 亚洲欧美激情在线视频| 影院欧美亚洲| 嫩草懂你的影院| 日韩综合视频在线观看| 日韩制服丝袜av| 头脑特工队2在线播放| 米奇精品一区二区三区在线观看| 午夜在线视频观看日韩17c| 理论片鲁丝二区爱情网| 黄黄视频在线观看| 日韩欧美亚洲范冰冰与中字| av中文一区| 午夜精品久久久久久久99热| 欧美日韩综合在线免费观看| 国产精品红桃| www成人在线观看| 色网站在线看| 日本高清+成人网在线观看| 韩国三级中文字幕hd久久精品| 极品美乳网红视频免费在线观看| 欧美日本在线视频中文字字幕| 久色婷婷小香蕉久久| 国产在线观看黄| 国产精品情侣自拍| 国产日韩欧美电影| 91精品产国品一二三产区| 国产一区二区三区高清| 亚洲妇熟xx妇色黄| 粉嫩av一区二区| 久久国产亚洲精品无码| 亚洲欧美日韩精品久久奇米色影视 | 国产亚洲福利一区| 亚洲影院免费| 天堂资源中文在线| 欧日韩在线观看| 中文av一区二区| www.豆豆成人网.com| 日韩中文字幕二区| 久热精品在线视频| 99久久久精品免费观看国产蜜| 波多视频一区| www.国产在线播放| 北条麻妃一区二区三区中文字幕 | 国产羞羞视频| 久久大大胆人体| 91香蕉视频黄| 在线播放一区二区精品视频| 日本xxxxxxx免费视频| 久久久久久久999| 国产精品污污网站在线观看| 999久久精品| 国产bdsm| 91精品久久久久久久久中文字幕| 亚洲国产精品麻豆| 香蕉综合视频| 日韩在线免费电影| 视频在线一区二区三区| 亚洲精品中文字幕女同| 国产一区香蕉久久| 亚洲男人av在线| 亚洲在线成人| 麻豆影院在线| 日韩av高清| 亚洲精品永久免费| 高清成人免费视频| 国产成人精品一区二三区在线观看| 在线国产99| 在线视频国产日韩| 久久九九全国免费| 欧美性生活一级片| 中国在线观看免费国语版电影 | 日本xxxxwwww| 日本高清不卡的在线| 欧美日韩亚洲网| 久久精品人人做人人爽电影蜜月| 忘忧草在线影院两性视频| 成人免费aaa| 国产精品h片在线播放| 欧美午夜在线一二页| 国模大尺度一区二区三区| 精品视频一区二区三区在线观看| 成片免费观看视频| 久久99精品久久久久久水蜜桃| 精品视频在线播放色网色视频| 久久综合精品国产一区二区三区 | 国产直播在线| 国产精品无码一本二本三本色| 国产一区二区香蕉|