国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

昆侖萬維攜手南洋理工大學搶發Q*算法:百倍提升7B模型推理能力

人工智能 新聞
研究證明,Q* 能夠幫助參數量僅為 7b 的小模型達到參數量比其大數十倍甚至百倍模型的推理能力,大幅提升模型的性能,并顯著降低了計算資源的需求。

自 OpenAI 的 Q* 項目曝光后,引發業內眾多討論。據現有信息匯總,Q* 項目被視作 OpenAI 在探索人工通用智能(Artificial General Intelligence, AGI)道路上的一次重大嘗試,有望在包括數學問題解決能力、自主學習和自我改進等多個層面對人工智能技術帶來革新性突破。

英偉達科學家 Jim Fan、圖靈獎得主 Yann LeCun 等參與討論 OpenAI 的 Q* 實現方式

Meta 科學家田淵棟則認為 Q* 是 Q-learning 和 A* 的結合,且天然地適合推理任務,尤其在數學推理方面

不過迄今為止 OpenAI 沒有公開關于 Q* 算法的具體細節,其效果究竟如何我們并不得而知。

昆侖萬維自 Q* 項目曝光以來,一直密切關注 Q* 的動向,且在第一時間就成立研究小組嘗試開發自己的 Q* 算法,希望打破 OpenAI 的封鎖,提升現有開源模型的推理能力。

經過數月的嘗試,昆侖萬維攜手新加坡南洋理工大學成功開發了一個名為 Q* 的算法,能夠顯著提升現有大模型的推理能力。在 GSM8K 數據集上,Q* 幫助 Llama-2-7b 提升至 80.8% 的準確率,超越了 ChatGPT;在 MATH 數據集上,Q* 幫助 DeepSeek-Math-7b 提升至 55.4% 的準確率,超越了 Gemini Ultra;在 MBPP 數據集上,Q* 幫助 CodeQwen1.5-7b-Chat 提升至 77.0% 的準確率,縮小了與 GPT-4 的編程水平差距。

論文:Q*: Improving Multi-step Reasoning for LLMs with Deliberative Planning

論文鏈接:https://arxiv.org/abs/2406.14283

Q* 能夠幫助小模型達到參數量比其大數十倍、甚至上百倍模型的推理能力,這一算法不僅大幅提升了小模型的性能,還顯著降低了計算資源的需求,為人工智能的廣泛應用帶來了全新可能,開創了高效智能的新紀元。

復雜推理任務全盤規劃

在《Q*: Improving Multi-step Reasoning for LLMs with Deliberative Planning》論文中,研究人員首先將大語言模型的推理軌跡分解為若干個狀態,對于每一個狀態,參考 DeepCubeA 中的設計,通過將定義 Path Cost 的 g (s_t) 函數和定義 Accumulated Reward 的 Q*(s_t, a_t) 集成到同一個 f (s_t) 函數內,實現了對歷史狀態收益和未來期望收益的綜合考慮。最后利用 A* 搜索算法對狀態進行最佳優先搜索,實現了對復雜推理任務的全盤規劃,從而提升開源模型在推理任務上的性能。

其中 g (s_t) 表示當前軌跡中的多個歷史狀態,既 {s1,...,s_t},的聚合收益。

具體 g (s_t) 的函數形式可以通過人為定義,例如判斷當前代碼是否符合語法規則等,或者通過構建 Process Reward Model (PRM) 進行監督學習得到;g (s_t) 中的聚合方式可以為求和,最大值,最小值等。

為了獲得狀態 - 動作對 (s_t, a_t) 的最優 Q 值以實現規劃,研究人員在當前 LLM 策略生成的數據上通過監督學習的方式訓練了一個代理 Q 值模型圖片。訓練過程中的真實標簽圖片可以由三種不同的方式得到,包括離線強化學習,蒙塔卡羅采樣估計和利用更強大的語言模型補全。

實驗結果表明,昆侖萬維本次所提出的 Q* 框架,可以顯著地提升 LLM 的推理能力,在 GSM8K 數據集上,Q* 幫助 Llama-2-7b 提升至 80.8% 的準確率,超越了 ChatGPT;在 MATH 數據集上,Q* 幫助 DeepSeek-Math-7b 提升至 55.4% 的準確率,超越了 Gemini Ultra; 在 MBPP 數據集上,Q* 幫助 CodeQwen1.5-7b-Chat 提升至 77.0% 的準確率,縮小了與 GPT-4 的編程水平差距。

研究證明,Q* 能夠幫助參數量僅為 7b 的小模型達到參數量比其大數十倍甚至百倍模型的推理能力,大幅提升模型的性能,并顯著降低了計算資源的需求。目前,Q* 的研究尚在初級階段,算法在各個環節還有進一步的改進空間。未來,昆侖萬維會繼續深入此項研究,不斷提升國產開源模型推理能力,打破 OpenAI 閉源封鎖,為人工智能前沿技術發展帶來全新可能。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-08-18 17:20:58

4D視頻生成AI

2025-07-17 07:19:35

2025-06-03 08:20:00

2010-09-09 14:56:45

信息化建設郵件安全263企業郵箱

2023-07-22 13:30:02

模型視覺

2023-05-11 11:53:35

模型評測

2025-09-10 18:03:16

AI智能體開源

2024-07-12 12:50:46

2016-07-15 16:59:42

江西云平臺

2024-12-13 14:30:00

AI模型數據

2025-06-23 09:01:00

2022-03-07 14:10:00

算法模型AI

2023-10-29 22:25:23

模型AI

2023-06-12 15:34:08

工具圖片

2025-04-07 08:35:00

3DAI生成

2023-04-27 15:54:02

模型研究

2013-07-24 15:35:30

思杰

2021-09-23 10:26:36

人臉識別人工智能數據

2025-10-16 09:00:00

點贊
收藏

51CTO技術棧公眾號

欧美日韩国产色视频| 欧美日本韩国一区二区三区| 日韩精品免费| 在线免费av网址| 国产精品91久久久| 日韩三级视频中文字幕| 丰满白嫩尤物一区二区| 日韩一区二区三区高清在线观看| 国产嫩草在线观看| 亚洲一区二区三区在线视频 | 在线播放欧美女士性生活| 日韩欧美另类中文字幕| 美女在线免费视频| 91免费在线视频| 五月天婷婷综合| 伊人久久大香线蕉综合四虎小说| 97蝌蚪自拍自窝| 欧美激情手机在线视频| av一级毛片| 日韩精品另类天天更新| 97视频免费在线观看| 欧美精品v国产精品v日韩精品| 国产成人日日夜夜| 一区二区影院| 久久久精品国产**网站| 欧美人与动牲性行为| 九色丨porny丨自拍入口| 欧美日韩精品中文字幕一区二区| 久久人人爽人人爽人人片av高请| 日韩欧美一区二区不卡| 亚洲激情校园春色| 99久久亚洲一区二区三区青草| 久操国产精品| 国产精品㊣新片速递bt| 高清av免费一区中文字幕| 欧美日韩在线三级| 精品福利在线观看| 午夜精品一区二区三区三上悠亚| av不卡免费在线观看| 国产精品日韩久久久| 不卡视频在线看| 久久国产精品久久国产精品| 日韩亚洲国产欧美| 日本少妇一区| 97影视大全免费追剧大全在线观看| 国产综合色一区二区三区| 国产午夜精品美女视频明星a级| 中文字幕视频一区| 国产亚洲精品v| 欧美亚洲日本一区二区三区| 国产一二三四在线视频| 成人黄色激情网站| 99久久伊人| 欧美黄色直播| 久久成人精品电影| 国产精品一区二区三区在线| 午夜欧美视频在线观看| 久久精品九九| 久久悠悠精品综合网| 午夜免费视频在线国产| 日韩国产欧美亚洲| 国产精品有限公司| 中文字幕亚洲无线码a| 亚洲精品菠萝久久久久久久| 美女日韩在线中文字幕| 一区二区三区在线资源| av电影在线网| 久久成人免费观看| 亚洲欧美色综合| 久久电影网站中文字幕 | 久草在线成人| 久久青草伊人| 日本一二三区视频免费高清| 综合久久国产| 国产日韩视频在线观看| 久久精品视频99| 日韩精品综合一本久道在线视频| 亚洲欧美另类小说| 成人小视频在线| 亚洲一区二区三区四区五区午夜| 欧美人与拘性视交免费看| 中文字幕在线官网| 欧美黑人激情| 中文字幕在线网| 国产精品乱码久久久久| 色噜噜狠狠一区二区三区| 国产欧美在线播放| 久久久久久久久久久国产| 亚洲美女久久久| 欧美一区二区黄| 色哟哟欧美精品| 91麻豆精品秘密| 国产美女主播一区| 国产中文字幕在线观看| 日韩有吗在线观看| 国产真实乱对白精彩久久| 一个色妞综合视频在线观看| 欧美成人三级在线视频| 国产精品美女诱惑| 热99精品里视频精品| 亚洲网站视频福利| 欧美丰满少妇xxxxx高潮对白 | 欧美日韩一区二区三区在线免费观看| 国产人成一区二区三区影院| 极品美女销魂一区二区三区| 精品96久久久久久中文字幕无| 教室别恋欧美无删减版| 久久69av| 成人国产一区| 久草在线资源福利站| 香蕉视频在线播放| 国产尤物视频在线| 在线免费福利| 色久视频在线观看| 日本wwwwwwwzzzzz视频| 亚洲人成无码www久久久| a级网站在线观看| 日韩中文字幕在线视频| 国产美女91呻吟求| 日本特黄a级片| 亚瑟国产精品| 91亚洲大成网污www| 精品国产91洋老外米糕| 精品久久久久久中文字幕动漫| 免费激情网址| 美国成人xxx| 国产欧美日韩另类一区| 亚洲欧美日韩第一区| 亚洲韩国在线| 又爽又大又黄a级毛片在线视频| 最新成人av网站| 久久免费电影网| 99re久久| 欧美高清视频手机在在线| 久久久亚洲午夜电影| 欧美日韩aaaa| heyzo高清中文字幕在线| 欧美成人a∨高清免费观看| 美女在线视频一区| 日本美女一区二区| 青青草97国产精品免费观看| 久久先锋资源| 蜜臀av性久久久久蜜臀aⅴ| 免费在线看成人av| 麻豆国产欧美日韩综合精品二区| 神马亚洲视频| av成人黄色| 一色桃子一区二区| 亚洲精品无码久久久久久| 久久午夜影院| 8x8x8国产精品| 亚洲一区二区三区精品在线观看 | 91亚洲国产成人久久精品| 椎名由奈av一区二区三区| 日产精品99久久久久久| 超碰影院在线| 在线观看亚洲| 久久亚洲国产精品成人av秋霞| 青青在线视频免费| 亚洲欧美综合国产精品一区| 国产午夜精品久久久| 2022亚洲天堂| 美女久久99| 一区二区三区视频在线观看| 国产精品欧美一区二区| 日本www在线观看视频| 综合亚洲深深色噜噜狠狠网站| 国产乱妇乱子| 在线观看国产91| 亚洲一区三区| 97久久精品人人澡人人爽| 成人高清视频在线| 中文在线资源观看网站视频免费不卡| 一区二区免费视频| 精品国产一区二区三区av片| 香蕉成人啪国产精品视频综合网 | 国产经典av| 99精品国产在热久久下载| 久久人人爽人人爽爽久久| 欧美精品久久久久久久久久丰满| 日韩国产精品久久久| 26uuu久久噜噜噜噜| 国产精品久久久久av电视剧| 香蕉成人伊视频在线观看| 亚洲精品乱码久久久久久蜜桃91| 亚洲精品亚洲人成在线| 亚洲品质视频自拍网| 国产高清视频在线观看| 亚洲人一二三区| 宅男av一区二区三区| 国产韩日影视精品| 国产精品久久久久久久电影| 综合欧美精品| 8x8x8国产精品| 最近免费观看高清韩国日本大全| 精品中文字幕一区二区三区| 国产蜜臀av在线一区二区三区 | 成人444kkkk在线观看| 狠狠综合久久| 国产树林野战在线播放|