国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

賬號設置退出

打破數據質量鴻溝！清華騰訊Bee項目發布1500萬高質量數據集，刷新MLLM全棧開源SOTA

2025-11-12 08:40:00

人工智能新聞

清華大學與騰訊混元團隊聯手推出了Bee項目。Bee不只是一個模型，它是一套全棧式、完全開放的解決方案，旨在從根本上拉近開源社區與頂尖模型之間的差距。

全開源多模態大模型（MLLM）的性能，長期被閉源和半開源模型“卡脖子”。

原來核心瓶頸不在模型結構，而在于“數據質量鴻溝”。

為了解決這一痛點，清華大學與騰訊混元團隊聯手推出了Bee項目。Bee不只是一個模型，它是一套全棧式、完全開放的解決方案，旨在從根本上拉近開源社區與頂尖模型之間的差距。

Bee項目的三大核心貢獻：

Honey-Data-15M：一個1500萬規模、經過多重精細清洗和創新的雙層CoT（思維鏈）擴充的高質量SFT數據集。
HoneyPipe & DataStudio：開源了從數據清洗到CoT增強的“全棧數據增強管線”，提供了一套透明、可復現的方法論。
Bee-8B：基于Honey-Data-15M訓練的全新8B模型，在多項基準上刷新了全開源MLLM的SOTA紀錄，性能匹敵甚至超越了主流半開源模型。

下面詳細來看。

背景與動機：打破“三層結構”的數據壁壘

當前的MLLM領域呈現出明顯的三層結構：(1) 頂尖的閉源模型（如Gemini 2.5、GPT-5），(2) 權重開放但數據私有的半開源模型（如Qwen2.5-VL、InternVL），以及 (3) 性能遠遠落后的全開源模型。

如上圖所示（分數為MMMU、Mathvista等五個數據集平均的結果），在Bee項目之前，全開源（Fully Open）模型在性能上與閉源（Closed Source）和半開源（Semi-Open）模型存在巨大鴻溝。

Bee團隊認為，這種差距的根源在于SFT階段的數據質量。

現有開源數據集普遍存在兩大頑疾：

普遍的噪聲：充斥著事實錯誤、圖文不匹配、格式混亂和低質量圖像。
復雜推理數據匱乏：極度缺乏高級能力（如長鏈條思維鏈CoT）所需的數據。

因此，Bee項目明確指出，全開源社區最可行的路徑不是盲目追求數據“數量”，而是聚焦于“數據質量”。

HoneyPipe：授人以漁的全棧數據增強管線

為了系統性地解決上述數據問題，團隊構建了HoneyPipe，一個基于DataStudio框架的、自動化的數據增強流程。

HoneyPipe的核心價值在于其透明可復現的三階段增強過程：

噪聲與無關性過濾 (Stage 1)：結合規則過濾（如剔除小尺寸/極端寬高比圖像）和模型過濾（使用Qwen2.5-VL-72B等強模型），確保圖文的語義一致性（例如，過濾掉“在只有橘子的圖像上提問函數問題”的樣本）。
短CoT增強與驗證 (Stage 2)：此階段是雙層CoT策略的基礎層。使用Qwen2.5-VL等模型將原始的簡短回答，擴充為包含明確步驟的“短CoT”響應。隨后，引入“LLM-as-a-Judge”進行保真度驗證，檢查新CoT的最終結論是否與原始答案一致（事實性問題需精確匹配，開放性問題需語義一致）。
長CoT增強循環 (Stage 3)：對于(1) 在上一階段保真度驗證失敗的樣本（通常意味著問題更復雜），或(2) 天生復雜的數據源（如VisualWebInstruct），將它們路由到此循環。團隊使用頂尖的專有MLLM來生成深度、多步驟的“長CoT”解題過程。

這一套“過濾-循環增強-驗證”的精細流程，最終產出了高質量的數據集。

Honey-Data-15M：雙層CoT賦能的高質量基石

HoneyPipe流程的最終產物是Honey-Data-15M，一個包含1500萬精心策劃樣本的大型多模態SFT數據集。

該數據集的核心特征是其雙層CoT推理結構：

約1220萬短CoT樣本：用于培養模型扎實的基礎邏輯和分步推理能力。
約270萬長CoT樣本：專為復雜問題設計，要求模型進行更深層次的綜合分析和推理。如上圖所示，數據集的來源多樣化，策略性地覆蓋了7大領域，確保了模型的全面發展：

Bee-8B：全開源MLLM的新標桿

為了驗證Honey-Data-15M的卓越效果，團隊開發了Bee-8B模型。

模型架構：

LLM基礎：Qwen3-8B
視覺編碼器：SigLIP2-so400m-patch14-384
投影器：一個簡單的兩層MLP

五階段訓練配方 (Recipe) ：

MLP預熱 (Stage 1)：僅訓練投影器，凍結LLM和視覺編碼器，使用1M圖像-字幕對。
視覺-語言對齊 (Stage 2)：全參數訓練，混合12.6M圖文對和1.43M純文本數據，以保留LLM的固有能力。
多模態SFT (Stage 3)：關鍵階段。在完整的Honey-Data-15M上進行訓練，全面注入雙層CoT所帶來的復雜推理能力。
高效精煉SFT (Stage 4)：在精心挑選的1M高質量子集 (Honey-Data-1M)上進行精調，該子集具有更合理的主題分布。
策略優化RL (Stage 5)：使用GRPO算法，在50K數據上進行RL訓練，以解決SFT階段常見的文本重復等問題，提升輸出可靠性。

Bee-8B的表現在全開源模型中全面領先，并在多個關鍵基準上匹敵或超越了Qwen2.5-VL-7B和InternVL3.5-8B等強大的半開源模型。

其最顯著的優勢完美印證了CoT數據的有效性：

數學與推理任務 (Math & Reasoning)：

在MathVerse基準上，Bee-8B-RL達到67.0分，顯著超越InternVL3.5-8B (61.5分) 。
在LogicVista上，Bee-8B-RL以61.3分登頂。
在DynaMath上，Bee-8B-SFT以41.3分奪魁。

圖表與文檔任務 (Table & Chart & OCR)：

在最具挑戰性的CharXiv-RQ（圖表推理）上，Bee-8B-RL獲得57.3分，以近12%的優勢超越所有對手（第二名45.4分）。

通用VQA任務 (General VQA)：

Bee-8B-RL在MMStar (71.4), MMMU-Pro (50.7), MMVet (83.9), 和 CountBench (93.0) 等多個綜合基準上均取得了優秀的SOTA分數。

Bee項目的工作直面并解決了阻礙全開源MLLM發展的核心數據質量問題。它有力地證明了一個核心論點：通過透明、可復現的方法論優先保證數據質量，是比盲目堆砌數據量更有效的策略。

Bee向社區提供的全棧式開源套件，包括Honey-Data-15M數據集（已開源）、HoneyPipe策管方法論（即將開源）、以及SOTA的Bee-8B模型，希望為開源社區提供一個全新的、高質量的基石。

論文地址：https://arxiv.org/abs/2510.13795

項目主頁：https://open-bee.github.io

數據集地址：https://huggingface.co/datasets/Open-Bee/Honey-Data-15M

責任編輯：張燕妮來源：量子位

數據 AI 模型

51CTO技術棧公眾號

業務
速覽

媒體

51CTO CIOAge HC3i

社區

51CTO博客鴻蒙開發者社區 AI.x社區

教育

51CTO學堂精培企業培訓 CTO訓練營

精品国产精品一区二区夜夜嗨| 日本不卡电影| 91亚洲精品乱码久久久久久蜜桃| 国产精品中文字幕久久久| 黑人巨大亚洲一区二区久| 亚洲女性喷水在线观看一区| 毛片av一区二区| 国产精品久久国产精麻豆99网站 | 黄色一区二区在线| 国产天堂视频在线观看| 很黄很黄激情成人| 欧美一二三视频| 日韩欧美精品电影| 精品1区2区3区| 区一区二日本| 中文一区二区完整视频在线观看| 午夜啪啪免费视频| 日韩一级不卡| 国产精品成人av在线| www一区二区三区| 欧美疯狂做受xxxx富婆| 最新在线地址| 亚洲视频免费在线观看| 日韩少妇内射免费播放18禁裸乳| 日本视频中文字幕一区二区三区| 亚洲japanese制服美女| 欧美日韩精品在线一区| 国内免费精品永久在线视频| 欧美大胆性生话| 亚洲国产精品va在线| 在线国产91| 欧美日韩国产综合草草| 黄视频在线观看免费| 色综合天天综合狠狠| 特级全黄一级毛片| 自拍偷拍亚洲综合| 国产成人精品无码播放| 91免费观看在线| 久久久精品在线视频| 99国产欧美久久久精品| 男女视频网站在线观看| 成人涩涩免费视频| 91精品国产一区二区三区蜜臀 | 亚洲国产日韩a在线播放| v888av成人| 国产精品视频第一区| 少妇人妻互换不带套| 久久久久久免费| 欧美a级免费视频| 国产精品一区二区91| 日本黄网站色大片免费观看| 国产麻豆精品theporn| av不卡在线免费观看| 久久一区国产| 成人妇女免费播放久久久| 国户精品久久久久久久久久久不卡| 黄色一区二区三区| 日韩国产一级片| 国产精品视频麻豆| 久草影视在线| 在线观看免费一区| 国内在线免费视频| 亚洲精品在线看| 精品123区| 久久6精品影院| 久热在线中文字幕色999舞| 亚洲一区二区3| 国产亚洲高清视频| 成人做爰视频www网站小优视频| 成人一级视频在线观看| 亚洲影影院av| 日本成人性视频| 国产盗摄——sm在线视频| 亚洲成年人影院在线| 国精产品一区二区三区有限公司| 久久精品国产2020观看福利| 亚洲毛片免费看| 国产精品一二三| 国产高清亚洲一区| 天堂中文av| 欧美mv日韩mv国产网站app| 免费视频观看成人| 国产色视频一区| 影音欧美亚洲| 色视频在线看| 999成人精品视频线3| 91成人看片| 性感美女极品91精品| 日本在线精品视频| 又黄又爽无遮挡| 久草成色在线| 亚洲一区欧美激情| 欧美精品丝袜中出| 国产一级二级三级精品| 午夜在线小视频| 男人天堂欧美日韩| 国产欧美一区二区精品仙草咪| 亚洲国产欧美一区二区三区同亚洲 | 在线看a视频| 久久悠悠精品综合网| 亚洲精品国久久99热| 色狠狠一区二区| 日本欧美在线视频| 欧洲一区二区在线| 欧美三级理伦电影| 国产乱码精品一区二区三区av| 日韩中文娱乐网| 91麻豆天美传媒在线| 亚洲va久久| 日本久久一区二区| 久久精品国产精品亚洲精品色| 久久国产精品久久久久久电车| 精品调教chinesegay| 日韩伦理片在线观看| 亚洲第一福利视频在线| 国产精品久久久久久久久久尿| 91福利免费在线| 欧美性极品xxxx娇小| 91久久精品一区二区| 欧美一区二区三区视频免费| 中文字幕在线中文字幕日亚韩一区| 精品国产一区二区三区在线| 国产精品毛片一区二区三区四区| 影音先锋久久资源网| 精品美女被调教视频大全网站| 日日干夜夜操s8| 亚洲视频成人| 韩国福利视频一区| 欧美最大成人综合网| 久久99国产精品免费网站| 中文字幕亚洲综合久久筱田步美| 成年网站免费| 色综合一区二区日本韩国亚洲 | 欧美日韩精品专区| 日本免费a视频| 国产精品片aa在线观看| 色七七影院综合| 欧美日韩在线二区| 欧美大胆人体bbbb| 国产三级视频在线看| 一区二区欧美国产| xxxx成人| 欧美日韩第一区日日骚| 免费看黄视频网站| 成人在线视频首页| 天天影视久久综合| 亚洲国产经典视频| 欧美网站免费观看| 国产伊人精品| 欧美亚洲成人免费| 国产脚交av在线一区二区| 成人综合日日夜夜| 3344国产精品免费看| 日韩精品三区| 日韩精品久久久久 | 国产自产v一区二区三区c| 欧美激情精品久久久久久免费印度| 99热这里有精品| 91视频免费在线| 精品成人自拍视频| 69久久夜色精品国产7777| 亚洲国产aⅴ精品一区二区| 国产成人精品自拍| 亚洲+小说+欧美+激情+另类| 欧美黑人狂野猛交老妇| 亚洲va中文在线播放免费| 日本视频一区二区在线观看| 玖玖玖国产精品| 国产日韩欧美精品| 亚洲精选视频在线| 九九热久久66| 亚洲国产清纯| 日韩毛片在线一区二区毛片| 国产亚洲一区二区在线观看| 欧美伦理片在线看| 久久久亚洲高清| 好久没做在线观看| 亚洲成人激情在线| 123成人网| 久久全球大尺度高清视频| 91亚洲资源网| 久久久国产在线视频| 国产91xxx| 日韩电影中文字幕| 久久久蜜桃一区二区人| 一本一生久久a久久精品综合蜜| 国产精品一卡二卡三卡| 欧美www视频| 超碰在线12| 国产午夜精品一区二区三区欧美 | 亚洲人亚洲人色久| 国产成人午夜视频网址| 岛国av一区| 国产精品久久久久久久久久ktv| 欧美1区2区3区| 自拍偷拍精选| 精品少妇一区二区三区在线播放| aaa在线播放视频| 欧美性受xxxx黑人猛交88| 日本亚洲免费观看|