国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

Gemini-3-Pro強勢登頂,GPT-5.1轉向“創作型選手”?丨多模態模型11月最新榜單揭曉 精華

發布于 2025-12-12 00:32
瀏覽
0收藏

多模態大模型的崛起,正在重新定義我們理解與使用 AI 的方式。當模型能夠像人類一樣,將圖像、文本、語音、視頻等信息自然融會貫通時,它便獲得了更完整、更真實的世界視角。跨模態的統一認知讓 AI 不再停留在“看見”“聽到”的感知層面,而是能夠讀懂語境、推演邏輯、輔助決策,展現出向通用智能邁進的關鍵能力。隨著算法、數據與算力的不斷進化,多模態大模型正加速從實驗室走向產業深處,在越來越多的應用場景中持續釋放價值,引領智能時代的全面升級與加速到來。

司南持續關注大模型的發展動態,基于閉源評測基準,近期針對國內外主流多模態模型進行了全面評測,現公布司南多模態模型 11 月評測榜單。

需要提示的是:由于榜單規則,為提升閉源評測集榜單的時效性與先進性,我們對部分舊模型進行了移除,并測試了他們的最新版本。

綜合榜單解讀

整體性能排名

  • 本次評測中,隨著 Gemini-3-Pro 的發布,榜單的最高得分再創新高,達到了 66.35。
  • 在整體性能上,Gemini-3-Pro 在空間感知能力上的大幅度領先以及在信息圖形感知能力上的優勢,助力其以大比分領先第二名的 Seed1.6-vision-250815,而其在視覺質量感知和多模態創作領域雖仍居于前列,但仍無法達到全方面領先。
  • 在其他本次新上榜的模型中,OpenAI 的 GPT-5.1 在綜合能力上有所下降,但在多模態創作領域卻能斬獲最高分,印證了 OpenAI 對 GPT-5.1 的 “更具對話感、更加溫暖” 的宣傳。Qwen3-VL-235B-A22B-Thinking 則再次成為最強開源多模態模型。

Gemini-3-Pro強勢登頂,GPT-5.1轉向“創作型選手”?丨多模態模型11月最新榜單揭曉-AI.x社區

深層洞察

開源模型再次沖擊榜單新高,推理模型優勢明顯
  • 開源模型 Qwen3-VL-235B-A22B-Thinking 躍居第三,超越 GLM-4.5V ,成為開源模型中排名第一的模型,進一步鞏固了國產多模態模型在開源賽道的領先地位。
  • 值得關注的是,推理模型,如 Qwen3-VL-235B-A22B-Thinking、GLM-4.5V,在多模態推理、信息圖形理解兩個領域擁有普遍的優勢,也導致推理模型普遍能夠在總榜單中獲得更高的排名。本次新入榜的 RBDash-v2.0-Thinking,在多模態推理維度獲得了顯著高于同參數量級指令模型的得分,展現了 Thinking 模式在該領域的有效性。
  • 而在視覺質量感知領域,反而是小模型和非推理的指令模型獲得了相對優勢。可見 Thinking 模式也非各個領域的萬能靈藥。
閉源模型突破瓶頸,有望引領多模態模型能力的進一步提升
  • Gemini-3-Pro 相比 Gemini-2.5-Pro 實現全維度提升:通用感知、空間感知、信息圖形、多模態推理等領域均有顯著進步,展現了 Google 在多模態領域的持續迭代能力。
  • Gemini-3-Pro 打破了上一季度第一梯隊模型集中在 60 分左右的格局,以總分 66 分大比分領先,這展示了多模態模型的進步仍有不俗潛力,相信在 Gemini-3-Pro 的刺激下,各大模型廠商也將能夠愈戰愈勇,將多模態模型的整體水平帶上一個新的臺階。
  • GPT-5.1 模型在多模態創作領域獲得了顯著提升,和 Qwen3-VL-235B-A22B-Thinking 共同打破了多模態創作領域的得分紀錄。但值得注意的是,GPT-5.1 在其他領域表現欠佳,整體得分僅達到 GPT-5-nano 水平,可見 GPT-5.1 是一個有些偏科的選手,也許是 OpenAI 為了回應前段時間 GPT-5 “缺少人情味” 的指摘,在創作領域重點發力。不知面對 Gemini-3-Pro 的挑戰,OpenAI 后續會交出一份怎樣的答卷。

榜單規則說明

本榜單基于閉源測試數據,對不同多模態模型在 通用感知、空間感知、視覺質量感知、信息圖形理解、多模態推理、多模態創作 六大能力維度上的表現進行了評測,并基于 歸一化分數 計算模型的平均得分進行排序。閉源評測基準擁有較為豐富的題目類型,包含單選、多選、填空、開放性創作等,且為中英文雙語,可以同時考驗模型的多語言理解能力。

Gemini-3-Pro強勢登頂,GPT-5.1轉向“創作型選手”?丨多模態模型11月最新榜單揭曉-AI.x社區

Gemini-3-Pro強勢登頂,GPT-5.1轉向“創作型選手”?丨多模態模型11月最新榜單揭曉-AI.x社區

子維度能力解讀

通用感知

在通用感知能力方面,閉源模型 Seed1.6-vision-250815 與 Gemini-3-Pro 并列第一。在通用感知測試中存在涉及人物識別的問題,其中 GPT 模型在此問題上現象比較嚴重,一定程度上影響了得分情況。下方的性能展示圖片標注了每個模型的拒答比率。

Gemini-3-Pro強勢登頂,GPT-5.1轉向“創作型選手”?丨多模態模型11月最新榜單揭曉-AI.x社區

視覺質量感知

在視覺質量感知方面,在前 5 名中 Qwen3-VL-235B-A22B-Instruct 為本次榜單新近上榜,此類任務涉及對圖像缺陷的判斷,這一特殊的任務類型,使很多綜合實力很強的模型得分不高,而一些小模型,如 SAIL-VL-2B、OVis2-8B 反而獲得了較高的得分。

Gemini-3-Pro強勢登頂,GPT-5.1轉向“創作型選手”?丨多模態模型11月最新榜單揭曉-AI.x社區

空間感知

在空間感知方面,很多新模型都獲得了較大幅度的提升。最為亮眼的當屬 Gemini-3-Pro,在此能力上大幅領先其他模型,展現了 Gemini 在世界知識上的強大能力。同樣亮眼的是新上榜的 VideoChatOnlineV2,獲得了與 Seed1.6-vision-250815 并列第一的好成績。

Gemini-3-Pro強勢登頂,GPT-5.1轉向“創作型選手”?丨多模態模型11月最新榜單揭曉-AI.x社區

信息圖形感知

在信息圖形感知方面,同樣是 Gemini-3-Pro 取得了排名第一的成績,但分差并沒有領先第二名的 Seed1.6 太多。開源模型則相較上期榜單在這一方面有一定性能提升,Qwen3-VL-235B-A22B-Thinking 追平了 GPT-5-mini-20250807,另外一個新上榜的模型 RBDash-v2.0-Thinking 以 38B 的參數量同樣躋身前十名的行列,期待開源模型能夠在后續取得更好的成績。

Gemini-3-Pro強勢登頂,GPT-5.1轉向“創作型選手”?丨多模態模型11月最新榜單揭曉-AI.x社區

多模態推理

在多模態推理方面,GPT-5-20250807 在評測中維持了第一名的成績,而 Gemini-3-Pro 則超越了前代 Gemini-2.5-Pro,成為了新的第二名。總體而言,閉源模型在推理能力方面占據較強的統治地位,開源模型仍在持續追趕中,Qwen3-VL-235B-A22B-Thinking 躋身前十,而開源模型中的第一名依然是 InternVL3.5-241B-A28B。

Gemini-3-Pro強勢登頂,GPT-5.1轉向“創作型選手”?丨多模態模型11月最新榜單揭曉-AI.x社區

多模態創作

在多模態創作方面,GPT-5.1 異軍突起,雖然在其他維度的能力僅為中上游,但在多模態創作能力上較第二名打出了一個較大的分差,可見 GPT 在創作領域的補強卓見成效。而 Qwen3-VL-235B-A22B-Thinking 和 Qwen3-VL-235B-A22B-Instruct 的表現同樣亮眼,兩個模型雙雙強勢進入前十名,打破了此前閉源模型在此維度的大幅領先地位。

Gemini-3-Pro強勢登頂,GPT-5.1轉向“創作型選手”?丨多模態模型11月最新榜單揭曉-AI.x社區圖片

本文轉載自??司南評測體系??,作者: 司南OpenCompass

已于2025-12-12 00:32:18修改
收藏
回復
舉報
回復
相關推薦
亚洲色在线视频| 亚洲va天堂va国产va久| 欧美黄色片在线观看| 97电影在线看视频| 久久免费看少妇高潮| 日韩欧美国产二区| 欧美黄免费看| 国产成人高清激情视频在线观看| 九九九伊在线综合永久| 日韩亚洲电影在线| 日本视频在线观看一区二区三区| 久久久精品免费网站| 亚洲午夜精品久久久久久浪潮| 大片网站久久| 色综合久综合久久综合久鬼88| 欧美性受ⅹ╳╳╳黑人a性爽| 亚洲图片欧美视频| 天天干天天玩天天操| 国产成人综合网| 日本精品一区二区三区不卡无字幕| 国产一区日韩| 欧美第一页在线| 奇米777日韩| 91精品在线观看入口| 九色porny在线观看| 国产欧美在线观看一区| 国产黄色片免费在线观看| 九一九一国产精品| 性欧美大战久久久久久久免费观看| 国产精品激情| 成人蜜桃视频| 欧美国产三区| 国产精品区一区二区三在线播放| 99免费精品| 91丨九色丨国产在线| 色88久久久久高潮综合影院| 91国在线精品国内播放| 一级毛片精品毛片| 日韩在线播放一区| 亚洲ww精品| 久久精品电影网站| 精品国产亚洲日本| 午夜美女久久久久爽久久| 91大神精品| 国产91精品网站| 日韩1区在线| 91久久精品在线| 国产精品大片| 欧美主播一区二区三区美女 久久精品人 | 免费av网站在线观看| 欧美日韩一卡二卡| 美女精品导航| 亚洲最大在线视频| 日韩中文字幕| 国产91色在线| 欧美日韩一区二区国产| 国产高清不卡av| 日韩福利电影在线| 国产一级大片免费看| 久久亚洲综合色一区二区三区 | 国内精品亚洲| 欧洲精品在线一区| 国产成人aaa| 色播五月综合网| 亚洲成人综合网站| 成人短视频在线观看| 中文字幕av一区二区三区谷原希美| 综合久久伊人| 国产精品视频在线观看| 国产欧美成人| 大片在线观看网站免费收看| 久久久综合视频| 中文视频在线| 欧美不卡一区二区三区| 精品一区二区三区中文字幕在线| 国产精品久久久久久久久久三级| 影音先锋久久久| 免费在线黄网站| 亚洲在线视频一区| 第一av在线| 97在线视频免费看| 中文精品在线| 免费av网址在线| 日本精品一区二区三区高清 | 日产精品久久久一区二区福利| 午夜片欧美伦| 一区不卡字幕| 久久综合色一综合色88| 簧片在线观看| 亚洲精品网站在线播放gif| 中文在线免费一区三区| 国产区一区二区| 成人国产精品免费观看视频| 骚视频在线观看| 亚洲精选在线观看| 国产日韩欧美综合在线| 最新在线观看av网站| 亚洲人成伊人成综合网久久久| 噜噜噜狠狠夜夜躁精品仙踪林| 91传媒视频免费| 成人永久看片免费视频天堂| 在线免费视频福利| www.亚洲成人| 亚洲激情婷婷| 日本aⅴ中文| 夜夜嗨av一区二区三区免费区| 久久国产中文字幕| 久久视频免费在线| 狠狠躁天天躁日日躁欧美| 亚洲人免费短视频| 国产精品免费看一区二区三区| 91丝袜美腿高跟国产极品老师| 精品三级久久久久久久电影聊斋| zzjj国产精品一区二区| 在线欧美三区| 亚洲精品久久久中文字幕| 欧美成人精品高清在线播放| 自拍偷拍精品| 国产一二三在线视频| 欧美在线999| 18国产精品| 中文字幕精品在线播放| 色综合天天性综合| 一区二区亚洲视频| 日本精品免费视频| 欧美在线观看视频一区二区| 国产精品巨作av| 黄色一级视频播放| 99精品视频在线免费观看| 日韩专区av| 91亚洲国产成人精品性色| 日韩理论片网站| 国产精品麻豆| 激情五月婷婷六月| 精品国产91洋老外米糕| 亚洲第一毛片| 日韩毛片在线一区二区毛片| 91精品国产91久久久久久不卡| 国产成人精品免费一区二区| 丝袜美女在线观看| 国产伦精品一区二区三区视频免费| 亚洲视频图片小说| 欧美成人一级| 欧美 国产 日本| 亚洲性视频网址| 狠狠色狠狠色合久久伊人| 男操女在线观看| 国产精品免费久久久久影院| 中文字幕一区二区日韩精品绯色| 四虎影视精品永久在线观看| 中国老女人av| 亚洲欧洲第一视频| 国产精品一品视频| 澳门av一区二区三区| 97视频在线免费| 亚洲人午夜精品免费| 加勒比av一区二区| 亚洲精品中文字幕| 成人高清dvd| 亚洲精品永久免费| av亚洲精华国产精华精华| 国产精品黄色片| 内射国产内射夫妻免费频道| 久久久成人精品视频| 久久久久国产免费免费| 视频精品一区| 免费h片在线| 91在线网站视频| 欧美挠脚心视频网站| 亚洲福利电影| 国产黄a三级三级三级av在线看| 亚洲免费av网址| 另类图片亚洲另类| 美女性感视频久久久| 欧美日韩国产成人精品| 免费一级在线观看| 国产日韩二区| 欧美精品一区二区三区一线天视频| 国产农村妇女精品一二区| 日本三级韩国三级欧美三级| 中文字幕一区二区三区四区五区六区| 北条麻妃在线视频观看| 中文字幕日韩在线视频| 久久久久国产精品麻豆ai换脸 | 色视频www在线播放| 91精品在线观| 欧美日韩在线播放三区四区| 麻豆91精品91久久久的内涵| 韩国精品视频在线观看| 日韩av在线中文| 91日本在线观看| 日韩久久久精品| 久久久久久久久岛国免费| 成人嫩草影院| 中文字幕中文字幕在线中高清免费版| 成人毛片100部免费看| 久久乐国产精品| 日本精品免费观看高清观看| 久久成人精品无人区| 国产精品jk白丝蜜臀av小说|