国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

打破數據質量鴻溝!清華騰訊Bee項目發布1500萬高質量數據集,刷新MLLM全棧開源SOTA

人工智能 新聞
清華大學與騰訊混元團隊聯手推出了Bee項目。Bee不只是一個模型,它是一套全棧式、完全開放的解決方案 ,旨在從根本上拉近開源社區與頂尖模型之間的差距。

全開源多模態大模型(MLLM)的性能,長期被閉源和半開源模型“卡脖子”。

原來核心瓶頸不在模型結構,而在于“數據質量鴻溝”。

為了解決這一痛點,清華大學與騰訊混元團隊聯手推出了Bee項目。Bee不只是一個模型,它是一套全棧式、完全開放的解決方案 ,旨在從根本上拉近開源社區與頂尖模型之間的差距。

Bee項目的三大核心貢獻:

  1. Honey-Data-15M:一個1500萬規模、經過多重精細清洗和創新的雙層CoT(思維鏈)擴充的高質量SFT數據集。
  2. HoneyPipe & DataStudio:開源了從數據清洗到CoT增強的“全棧數據增強管線”,提供了一套透明、可復現的方法論。
  3. Bee-8B:基于Honey-Data-15M訓練的全新8B模型,在多項基準上刷新了全開源MLLM的SOTA紀錄,性能匹敵甚至超越了主流半開源模型。

下面詳細來看。

背景與動機:打破“三層結構”的數據壁壘

當前的MLLM領域呈現出明顯的三層結構:(1) 頂尖的閉源模型(如Gemini 2.5、GPT-5),(2) 權重開放但數據私有的半開源模型(如Qwen2.5-VL、InternVL),以及 (3) 性能遠遠落后的全開源模型。

如上圖所示(分數為MMMU、Mathvista等五個數據集平均的結果),在Bee項目之前,全開源(Fully Open)模型在性能上與閉源(Closed Source)和半開源(Semi-Open)模型存在巨大鴻溝。

Bee團隊認為,這種差距的根源在于SFT階段的數據質量

現有開源數據集普遍存在兩大頑疾:

  1. 普遍的噪聲:充斥著事實錯誤、圖文不匹配、格式混亂和低質量圖像。
  2. 復雜推理數據匱乏:極度缺乏高級能力(如長鏈條思維鏈CoT)所需的數據。

因此,Bee項目明確指出,全開源社區最可行的路徑不是盲目追求數據“數量”,而是聚焦于“數據質量”

HoneyPipe:授人以漁的全棧數據增強管線

為了系統性地解決上述數據問題,團隊構建了HoneyPipe,一個基于DataStudio框架的、自動化的數據增強流程。

HoneyPipe的核心價值在于其透明可復現的三階段增強過程

  1. 噪聲與無關性過濾 (Stage 1):結合規則過濾(如剔除小尺寸/極端寬高比圖像 )和模型過濾(使用Qwen2.5-VL-72B等強模型 ),確保圖文的語義一致性(例如,過濾掉“在只有橘子的圖像上提問函數問題”的樣本 )。
  2. 短CoT增強與驗證 (Stage 2):此階段是雙層CoT策略的基礎層。使用Qwen2.5-VL等模型將原始的簡短回答,擴充為包含明確步驟的“短CoT”響應。隨后,引入“LLM-as-a-Judge”進行保真度驗證,檢查新CoT的最終結論是否與原始答案一致(事實性問題需精確匹配,開放性問題需語義一致 )。
  3. 長CoT增強循環 (Stage 3):對于(1) 在上一階段保真度驗證失敗的樣本(通常意味著問題更復雜),或(2) 天生復雜的數據源(如VisualWebInstruct),將它們路由到此循環。團隊使用頂尖的專有MLLM來生成深度、多步驟的“長CoT”解題過程。

這一套“過濾-循環增強-驗證”的精細流程,最終產出了高質量的數據集。

Honey-Data-15M:雙層CoT賦能的高質量基石

HoneyPipe流程的最終產物是Honey-Data-15M,一個包含1500萬精心策劃樣本的大型多模態SFT數據集。

該數據集的核心特征是其雙層CoT推理結構

  • 約1220萬 短CoT樣本:用于培養模型扎實的基礎邏輯和分步推理能力。
  • 約270萬 長CoT樣本:專為復雜問題設計,要求模型進行更深層次的綜合分析和推理。如上圖所示,數據集的來源多樣化,策略性地覆蓋了7大領域,確保了模型的全面發展:

Bee-8B:全開源MLLM的新標桿

為了驗證Honey-Data-15M的卓越效果,團隊開發了Bee-8B模型。

模型架構:

  • LLM基礎:Qwen3-8B
  • 視覺編碼器:SigLIP2-so400m-patch14-384
  • 投影器:一個簡單的兩層MLP

五階段訓練配方 (Recipe) :

  1. MLP預熱 (Stage 1):僅訓練投影器,凍結LLM和視覺編碼器,使用1M圖像-字幕對。
  2. 視覺-語言對齊 (Stage 2):全參數訓練,混合12.6M圖文對和1.43M純文本數據,以保留LLM的固有能力。
  3. 多模態SFT (Stage 3):關鍵階段。在完整的Honey-Data-15M上進行訓練,全面注入雙層CoT所帶來的復雜推理能力。
  4. 高效精煉SFT (Stage 4):在精心挑選的1M高質量子集 (Honey-Data-1M)上進行精調,該子集具有更合理的主題分布。
  5. 策略優化RL (Stage 5):使用GRPO算法 ,在50K數據上進行RL訓練 ,以解決SFT階段常見的文本重復等問題,提升輸出可靠性。

Bee-8B的表現在全開源模型中全面領先,并在多個關鍵基準上匹敵或超越了Qwen2.5-VL-7B和InternVL3.5-8B等強大的半開源模型。

其最顯著的優勢完美印證了CoT數據的有效性:

  1. 數學與推理任務 (Math & Reasoning):
  • 在MathVerse基準上,Bee-8B-RL達到67.0分,顯著超越InternVL3.5-8B (61.5分) 。
  • 在LogicVista上,Bee-8B-RL以61.3分登頂 。
  • 在DynaMath上,Bee-8B-SFT以41.3分奪魁 。
  1. 圖表與文檔任務 (Table & Chart & OCR):
  • 在最具挑戰性的CharXiv-RQ(圖表推理)上,Bee-8B-RL獲得57.3分,以近12%的優勢超越所有對手(第二名45.4分) 。
  1. 通用VQA任務 (General VQA):
  • Bee-8B-RL在MMStar (71.4), MMMU-Pro (50.7), MMVet (83.9), 和 CountBench (93.0) 等多個綜合基準上均取得了優秀的SOTA分數 。

Bee項目的工作直面并解決了阻礙全開源MLLM發展的核心數據質量問題。它有力地證明了一個核心論點:通過透明、可復現的方法論優先保證數據質量,是比盲目堆砌數據量更有效的策略。

Bee向社區提供的全棧式開源套件,包括Honey-Data-15M數據集(已開源)、HoneyPipe策管方法論(即將開源)、以及SOTA的Bee-8B模型,希望為開源社區提供一個全新的、高質量的基石。

論文地址:https://arxiv.org/abs/2510.13795

項目主頁:https://open-bee.github.io

數據集地址:https://huggingface.co/datasets/Open-Bee/Honey-Data-15M

責任編輯:張燕妮 來源: 量子位
相關推薦

2023-09-01 14:42:39

數據研究

2020-01-09 11:30:40

AI 數據人工智能

2025-07-23 04:00:00

2022-11-03 15:10:24

前端數據結構算法

2025-08-27 07:17:00

數據驅動數據治理大數據

2025-08-22 09:05:00

2025-02-18 15:03:58

數據AI模型

2025-11-28 10:19:32

2015-06-19 16:28:28

InformaticaCRM廣州銀行

2020-12-01 13:56:56

人工智能AI數據

2017-06-19 07:58:40

2025-02-11 16:11:12

2025-11-24 09:00:00

2010-07-06 11:52:59

數據庫RationalJazz

2024-08-26 15:20:45

2025-04-14 09:26:00

點贊
收藏

51CTO技術棧公眾號

精品国产精品一区二区夜夜嗨| 日本不卡电影| 91亚洲精品乱码久久久久久蜜桃| 国产精品中文字幕久久久| 黑人巨大亚洲一区二区久| 亚洲女性喷水在线观看一区| 毛片av一区二区| 国产精品久久国产精麻豆99网站 | 黄色一区二区在线| 国产天堂视频在线观看| 很黄很黄激情成人| 欧美一二三视频| 日韩欧美精品电影| 精品1区2区3区| 区一区二日本| 中文一区二区完整视频在线观看| 午夜啪啪免费视频| 日韩一级不卡| 国产精品成人av在线| www一区二区三区| 欧美疯狂做受xxxx富婆| 最新在线地址| 亚洲视频免费在线观看| 日韩少妇内射免费播放18禁裸乳| 日本视频中文字幕一区二区三区| 亚洲japanese制服美女| 欧美日韩精品在线一区| 国内免费精品永久在线视频| 欧美大胆性生话| 亚洲国产精品va在线| 在线国产91| 欧美日韩国产综合草草| 黄视频在线观看免费| 色综合天天综合狠狠| 特级全黄一级毛片| 自拍偷拍亚洲综合| 国产成人精品无码播放| 91免费观看在线| 久久久精品在线视频| 99国产欧美久久久精品| 男女视频网站在线观看| 成人涩涩免费视频| 91精品国产一区二区三区蜜臀 | 亚洲国产日韩a在线播放| v888av成人| 国产精品视频第一区| 少妇人妻互换不带套| 久久久久久免费| 欧美a级免费视频| 国产精品一区二区91| 日本黄网站色大片免费观看| 国产麻豆精品theporn| av不卡在线免费观看| 久久一区国产| 成人妇女免费播放久久久| 国户精品久久久久久久久久久不卡| 黄色一区二区三区| 日韩国产一级片| 国产精品视频麻豆| 久草影视在线| 在线观看免费一区| 国内在线免费视频| 亚洲精品在线看| 精品123区| 久久6精品影院| 久热在线中文字幕色999舞| 亚洲一区二区3| 国产亚洲高清视频| 成人做爰视频www网站小优视频| 成人一级视频在线观看| 亚洲影影院av| 日本成人性视频| 国产盗摄——sm在线视频| 亚洲成年人影院在线| 国精产品一区二区三区有限公司| 久久精品国产2020观看福利| 亚洲毛片免费看| 国产精品一 二 三| 国产高清亚洲一区| 天堂中文av| 欧美mv日韩mv国产网站app| 免费视频观看成人| 国产色视频一区| 影音欧美亚洲| 色视频在线看| 999成人精品视频线3| 91成人看片| 性感美女极品91精品| 日本在线精品视频| 又黄又爽无遮挡| 久草成色在线| 亚洲一区欧美激情| 欧美精品丝袜中出| 国产一级二级三级精品| 午夜在线小视频| 男人天堂欧美日韩| 国产欧美一区二区精品仙草咪| 亚洲国产欧美一区二区三区同亚洲 | 在线看a视频| 久久悠悠精品综合网| 亚洲精品国久久99热| 色狠狠一区二区| 日本欧美在线视频| 欧洲一区二区在线| 欧美三级理伦电影| 国产乱码精品一区二区三区av| 日韩中文娱乐网| 91麻豆天美传媒在线| 亚洲va久久| 日本久久一区二区| 久久精品国产精品亚洲精品色| 久久国产精品久久久久久电车| 精品调教chinesegay| 日韩伦理片在线观看| 亚洲第一福利视频在线| 国产精品久久久久久久久久尿| 91福利免费在线| 欧美性极品xxxx娇小| 91久久精品一区二区| 欧美一区二区三区视频免费| 中文字幕在线中文字幕日亚韩一区| 精品国产一区二区三区在线| 国产精品毛片一区二区三区四区| 影音先锋久久资源网| 精品美女被调教视频大全网站| 日日干夜夜操s8| 亚洲视频成人| 韩国福利视频一区| 欧美最大成人综合网| 久久99国产精品免费网站| 中文字幕亚洲综合久久筱田步美| 成年网站免费| 色综合一区二区日本韩国亚洲 | 欧美日韩精品专区| 日本免费a视频| 国产精品片aa在线观看| 色七七影院综合| 欧美日韩在线二区| 欧美大胆人体bbbb| 国产三级视频在线看| 一区二区欧美国产| xxxx成人| 欧美日韩第一区日日骚| 免费看黄视频网站| 成人在线视频首页| 天天影视久久综合| 亚洲国产经典视频| 欧美网站免费观看| 国产伊人精品| 欧美亚洲成人免费| 国产脚交av在线一区二区| 成人综合日日夜夜| 3344国产精品免费看| 日韩精品三区| 日韩精品久久久久 | 国产自产v一区二区三区c| 欧美激情精品久久久久久免费印度| 99热这里有精品| 91视频免费在线| 精品成人自拍视频| 69久久夜色精品国产7777| 亚洲国产aⅴ精品一区二区| 国产成人精品自拍| 亚洲+小说+欧美+激情+另类| 欧美黑人狂野猛交老妇| 亚洲va中文在线播放免费| 日本视频一区二区在线观看| 玖玖玖国产精品| 国产日韩欧美精品| 亚洲精选视频在线| 九九热久久66| 亚洲国产清纯| 日韩毛片在线一区二区毛片| 国产亚洲一区二区在线观看| 欧美伦理片在线看| 久久久亚洲高清| 好久没做在线观看| 亚洲成人激情在线| 123成人网| 久久全球大尺度高清视频| 91亚洲资源网| 久久久国产在线视频| 国产91xxx| 日韩电影中文字幕| 久久久蜜桃一区二区人| 一本一生久久a久久精品综合蜜| 国产精品一卡二卡三卡| 欧美www视频| 超碰在线12| 国产午夜精品一区二区三区欧美 | 亚洲人亚洲人色久| 国产成人午夜视频网址| 岛国av一区| 国产精品久久久久久久久久ktv| 欧美1区2区3区| 自拍偷拍精选| 精品少妇一区二区三区在线播放| aaa在线播放视频| 欧美性受xxxx黑人猛交88| 日本亚洲免费观看|