国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

GPT-5.2發布,真正的牛馬打工人專屬AI來了

人工智能
GPT-5.2在我心中,是一個合格的迭代,并沒有跟很多模型一樣,專注于純粹的傳統刷分,而是聚焦在了廣大白領打工人身上,幫大家解決實際工作中的問題。

在各種小道消息,各種預測之后。

終于,在OpenAI十周年的這一天。

圖片

也就是今天的凌晨2點,GPT-5.2終于跟大家見面了。

圖片

這是Gemini 3 Pro爆火,第一次讓OpenAI沒有領先優勢,奧特曼在內部官宣紅色警戒狀態之后,他們掏出的第一款模型。

也是OpenAI的十周年獻禮。

而這款模型的特點也非常有意思。

OpenAI的原話是:

We are introducing GPT?5.2, the most capable model series yet for professional knowledge work.(我們正式發布 GPT-5.2,這是迄今為止在專業知識工作方面能力最強的一代模型系列。)

專業知識工作,記住這個關鍵詞,后面要考。

我們先從各種跑分上看,其實能看到,一些跑分其實沒有質的飛躍,有一種數碼廠開始擠牙膏的感覺。。。

圖片

對比了GPT-5.2、GPT-5.1、Claude Opus 4.5和Gemini 3 Pro。

在軟件工程(SWE-Bench Pro)、科學問題(GPQA Diamond)、數學競賽(AIME 2025)這些傳統評測集上。

GPT-5.2確實又強了一些,也回到了第一的位置,全面領先。

在前端審美還有3D元素上,表現的更牛逼了。

圖片圖片

在視覺理解能力上也更強了。

比如要求模型識別圖像輸入中的組件,并返回帶有近似邊界框的標簽。

即使在低質量的圖像上,GPT-5.2也能識別主要區域并放置與每個組件真實位置大致匹配的框,而GPT-5.1只標注了幾個部分,對它們的空間排列理解不是很好。

圖片圖片

但是這些東西,說實話,確實也就那樣,大家很難體感上還覺得有多牛逼。

就像芯片廠子告訴你,我的手機芯片性能又提升了25%,你聽了以后,哦確實強,但是完全不影響你繼續刷抖音和小紅書對吧。

不過有兩個評測集,是我覺得這次GPT-5.2最大的亮點,且一定要單拎出來,跟大家單獨聊一下的。

一個是ARC-AGI-2,一個是GDPval。

這兩個,非常有意思。

圖片圖片

先說ARC-AGI-2。

過去的AI評測,比如MMLU,考的主要是是知識。

比如它會問你“美國第一任總統是誰?”、“光合作用的化學方程式是什么?”。

這種評測呢,坦率的講,對于一個讀了半個互聯網的AI來說,有點像開卷考試,它有很大概率不是真的推理出來的,而是背出來的。

這就導致一個問題,在實際的評測中,我們分不清AI是真的聰明,還是只是記性好。

于是,Fran?ois Chollet,就是那位Keras(一個著名的機器學習框架)之父,2019年第一次在論文《On the Measure of Intelligence》里,提出了ARC這個變態測試。

而這個測試,跟知識儲備一毛錢關系都沒有。

全名叫,Abstraction and Reasoning Corpus,抽象與推理語料庫。

設計目標就是測模型的通用智能的能力。

大概就是,不看你在某一道題上有多熟練,而是是看你在沒見過的新題上,能不能自己推理出規則、舉一反三。

目前正式版發展到了第二代,也就是ARC-AGI-2,我給大家放一下,ARC-AGI-2里面的一些典型的題目,大家就懂了。

圖片圖片

圖片圖片

圖片圖片

這種能力,現在稱為流體智力(Fluid Intelligence),意思就是指不依賴于已有的知識,在全新情境下進行邏輯推理、識別模式和解決問題的能力。

說白了,就是你的悟性開竅的能力。

這玩意兒對AI來說,難于登天。

因為它在互聯網上找不到任何現成的答案,它必須當場理解、當場推理

在很長一段時間里,頂級AI的得分都低得可憐。

在ARC-AGI-2上,之前GPT-5.1的得分是17.6%,而GPT-5.2,直接飆到了52.9%。

直接翻了三倍。

這是一個很恐怖的數據。

GPT-5.2的模型,直接在排行榜上屠榜了。

圖片圖片

而且,效率還很高。

圖片圖片

基本都在同成本區間,能力做到了最高。

在真正的智力水平上,GPT-5.2確實達到了目前的最優。

這就比較有意思了。

然后是第二個,也是我自己現在最關心、也是我認為最重要的一個:

GDPval。

可能很多人沒聽說過這個評測集。

他是OpenAI自己在2個半月前新出的。

圖片圖片

其實你看這個名字也能看出來一點端倪。

GDPval,就是生產總值的那個GDP。

他們要用一個全新的標準,來衡量AI在真實世界中、具有經濟價值的任務上的表現。

過去,我們說一個模型牛逼,是因為它代碼寫得好,或者知識答得準,或者考試分數高。

這當然很重要,但就像我常說的,這個世界不只有程序員和科學家。

還有律師、設計師、市場經理、護士、建筑師、銷售……

無數專業知識工作者。

他們工作的價值,其實很難用一張考卷來衡量。

于是,OpenAI他們在美國貢獻GDP最高的9個行業里,選取了44個核心職業,然后,他們找到了在這些行業里平均有14年工作經驗的資深專家,讓他們出了1320道專業知識任務,并且每一項,都基于真實工作成果。

圖片圖片

比如,給律師的任務,可能就是一份真實的合同草案和客戶需求,讓他去審閱和修改。

給市場經理的任務,可能就是一堆產品資料和市場數據,讓他寫一份營銷方案PPT。

給制造工程師的任務,可能就是一張產品設計圖,讓他優化生產流程。

這些任務,不僅有文字,還可能包含PDF、Excel表格、圖片、PPT,是高度復雜的、多模態的、沒有標準答案的真實工作。

整套任務的平均用時,是人類專家要花 7 個小時才能做完,有些甚至是一兩周的活。

然后,模型和人類的成果,會被同領域的另一批專家進行盲評。

他們也不知道誰是AI,誰是人類。

評委只需要回答一個問題:你更愿意把哪份交給客戶?是這份,還是這份?

結果,GPT-5.2 Thinking在這套 GDPval 上,贏或打平行業專家的比例,達到了70.9%,而GPT-5.2 Pro 模型是74.1%。

注意,這里的參照系不是普通實習生,而是行業專家。

也就是說,在一個有著十幾年經驗的采購經理、或者審計師面前,GPT-5.2干出來的活兒,有七成的時候,比專家干得好,或者至少一樣好。

而 GPT-5,只有 38.8%。

圖片圖片

這個進步的速度,還有有一點快的。

看一下官方放的case的對比,還是比較直觀的。

圖片

圖片

我們過去的模型,都花過于著重的筆墨在編程開發上了,我并不是說編程開發不重要,它很重要,很牛逼。

但,其他的領域的工作,我也覺得應該被重視。

而GDPval,就是我認為最重要的一個指標。

而且這次GPT-5.2,在上下文上,也有大幅的加強。

用我們以前的大海撈針測試,在一個256K的巨型文檔里面埋四根針,讓AI來根據文檔內容回答。

圖片圖片

GPT-5.2干到了離譜的100%,這也是我印象中,唯一一個能干到100%的。

8根針的正確度會下降,但是這個衰減,已經比GPT-5.1牛逼太多了。

圖片

而且,還有最新的知識庫截止日期:

圖片

牛逼的知識工作處理+最新的知識庫截止日期+更棒的智力+準確性超高的上下文。

這簡直,就是真正的天選牛馬搭子,對打工人的加持,實在是太強了。

這是真正,奔著大眾、奔著實用去的。

目前今天會開放給ChatGPT付費會員,明天會開放給免費會員,會直接替代GPT-5.1,但是如果你是付費會員的話,還會在老模型中存續3個月。

就是這。

圖片

可惜截止到我發文的凌晨6點這一刻,作為尊貴的200刀的ChatGPT Pro會員,我還是沒有拿到GPT-5.2的體驗資格。

圖片

一些所謂的ChatGPT上的為GPT-5.2專用的文件精修,也只能等拿到實測以后,再出一篇GPT-5.2的打工合集了。

然后開發者的話,已經可以通過API調用。

圖片

價格上,會比5.1貴一些。

圖片

整體上,GPT-5.2的所有消息差不多就這樣了。

而我自己一直期待的,成人模式。

還是沒有到來。

奧特曼自己這個龜兒子說的是12月上線。

圖片

也不知道能不能等到。

反正他說,下周還會再送一些小的圣誕禮物。

圖片

盲猜一手OpenAI家的生圖模型,或者成人模式。

對于一個創作者來說,這兩玩意,真的很需要。。。

最后總結,GPT-5.2在我心中,是一個合格的迭代,并沒有跟很多模型一樣,專注于純粹的傳統刷分,而是聚焦在了廣大白領打工人身上,幫大家解決實際工作中的問題。

這個點,我覺得就很酷,非常的剛需。

但是從路線上來說,感覺GPT-5.2還是被原生多模態的Gemini 3 Pro壓了一頭,12月大概率還是要發個生圖模型出來的,不知道對標Banana,會不會有新的驚喜。

總之,還是保持期待。

反正每一個新模型的發布,只要是我覺得有意思的。

也一定會熬夜給大家帶來第一時間的解讀。

我們以后。

還是,不見不散~

晚安。

責任編輯:武曉燕 來源: 數字生命卡茲克
相關推薦

2015-07-13 14:24:48

Kubernetes容器平臺Google

2020-11-03 21:11:39

IT

2021-02-25 15:47:08

IT

2022-07-04 16:27:50

華為HarmonyOS

2025-11-13 09:00:00

2025-04-29 16:12:28

AI模型訓練

2025-08-20 09:02:00

2009-02-25 09:35:12

LinuxBASH 4.0OS X v10.4

2011-11-02 17:08:48

OpenBSD發布

2012-03-15 16:46:02

JavaMyBatis

2009-09-27 13:41:55

Eclipse 3.5

2009-06-21 13:37:53

2011-06-07 10:07:06

LibreOffice

2011-02-24 09:36:33

LibreOffice

2012-11-14 09:31:13

CloudStackIaaSCitrix

2012-03-15 09:57:59

JavaDynamicRepo

2011-08-02 09:15:49

LibreOffice

2011-12-21 08:58:23

Java

2015-04-17 16:00:57

Docker1.6Windows客戶端

2012-02-24 09:11:29

JavaJikes
點贊
收藏

51CTO技術棧公眾號

日韩风俗一区 二区| 日韩中文字幕在线视频| 亚洲一区二区三区涩| 日韩成人一级| 在线电影院国产精品| 免费国产黄色网址| 亚洲久久视频| 国产成人福利网站| 日韩成人亚洲| 欧美日韩午夜在线视频| 羞羞小视频视频| yw视频在线观看| 轻轻草成人在线| 久久亚洲精品毛片| 黄网页在线观看| 亚洲最新视频在线观看| 国产av熟女一区二区三区| 亚洲美女一区| 日韩av电影中文字幕| 成人爽a毛片免费啪啪| 欧美最新大片在线看| 黄色片在线免费| 国产乱人伦偷精品视频不卡| 久久久人人爽| 欧美日本二区| 国产女人18毛片水18精品| 一区二区三区在线资源| 中文字幕亚洲欧美日韩在线不卡| 亚洲性图自拍| 欧美麻豆精品久久久久久| 最新av中文字幕| 国产精品午夜电影| 全黄性性激高免费视频| 久久精品av麻豆的观看方式| 国偷自产av一区二区三区小尤奈| 欧美激情在线免费| 高清欧美性猛交| 久久爱www.| 永久555www成人免费| 九九精品调教| 亚洲成人网在线| 青青草视频在线免费直播| 欧美日韩国产丝袜另类| 天天草夜夜草| 亚洲成a人片在线观看中文| 国产三级三级看三级| 国产精品网站一区| 成人3d漫画免费无遮挡软件| 国产欧美精品一区二区色综合朱莉| 日本高清视频免费在线观看| 久久精品国产精品亚洲综合| 在线视频欧美一区| 国产呦精品一区二区三区网站| 国产精品h视频| 国产福利91精品一区二区三区| 永久免费网站视频在线观看| 国产精品一级片| 国产精品秘入口18禁麻豆免会员 | 99久久国产免费免费| 一区二区三区在线| 国产成人成网站在线播放青青| 伊人成人网在线看| 日本不卡免费新一二三区| 久久国产三级精品| 妞干网在线视频观看| 国产精品私人影院| 中午字幕在线观看| 欧美日韩成人在线一区| 免费电影视频在线看| 色青青草原桃花久久综合| swag国产精品一区二区| 国产精品女人久久久久久| 一区二区三区国产在线| 日本老太婆做爰视频| 国产偷国产偷精品高清尤物| 视频在线91| 日韩精品一区二区三区swag| 欧美91在线|欧美| 国产大片精品免费永久看nba| 一区二区三区在线电影| 欧美激情专区| 久久免费看少妇高潮| 成r视频免费观看在线播放| 欧美福利一区二区| 精品欧美一区二区三区在线观看| 午夜精品福利电影| 亚洲国产精品一区制服丝袜| 国产成人亚洲综合无码| 亚洲三级电影全部在线观看高清| 中文字幕在线播放| 日韩在线小视频| 香蕉国产精品| 国产911在线观看| 一区二区三区高清| 黄页网站大全在线免费观看| 欧美激情精品久久久久久大尺度 | 国产在线播放91| 亚洲一区二区三区四区五区午夜| 国产尤物av一区二区三区| 国产精品国产成人国产三级| 污污的网站在线观看| 亚洲精品在线电影| 欧亚精品一区| 日韩三级电影免费观看| 国产精品久久久一区麻豆最新章节| 国产高清一区在线观看| 色噜噜久久综合伊人一本| 亚洲蜜桃视频| 欧美综合在线播放| 精品视频一区二区三区免费| 综合久久成人| 婷婷五月色综合| 亚洲一区二区三区三| 2020国产精品自拍| 香蕉视频一区| 国产精品一区二区欧美| 99久久久国产精品| a视频网址在线观看| 色综合五月天导航| 蜜臀av性久久久久蜜臀aⅴ| 男人捅女人免费视频| 日韩精品视频免费| 亚洲老妇激情| 免费一级特黄录像| 亚洲国产精品va在看黑人| 天天影视欧美综合在线观看| 成人久久久久久久久| 日韩欧美亚洲国产精品字幕久久久| 夜夜躁狠狠躁日日躁2021日韩| 亚洲欧洲一区二区在线观看| 婷婷一区二区三区| 日韩视频1区| 黄色特一级视频| 日韩欧美电影一二三| 亚洲综合婷婷| 国产国产国产国产国产国产| 亚洲视频在线播放| 免费观看一级特黄欧美大片| av电影在线网| 91九色精品视频| 亚洲最色的网站| 亚洲2区在线| 97av中文字幕| 亚洲激情中文字幕| 亚洲欧美日韩精品一区二区 | 久久久精品中文字幕麻豆发布| 在线播放蜜桃麻豆| 国产精品久久久久久久久久久久午夜片 | 北条麻妃久久精品| 国产一区二区三区综合| 国内精品久久久久国产| 成人免费直播live| 一区二区三区在线免费观看| 91精品丝袜国产高跟在线| 久久久久久免费看| 亚洲老板91色精品久久| 国产尤物一区二区| 成人免费无遮挡| 黄瓜视频免费观看在线观看www| 日韩一区二区视频| 久久国产福利| 成人超碰在线| wwwjizzjizzcom| 亚洲香蕉成视频在线观看| 成人动漫精品一区二区| 日韩城人网站| 一本大道熟女人妻中文字幕在线| xvideos亚洲人网站| 欧美国产精品v| 狼人精品一区二区三区在线| 男人本色网站| 亚洲精品免费在线视频| 欧美性色xo影院| 国产欧美精品久久| 波多野结衣在线播放| 日本丰满大乳奶| 久久久精品国产网站| 中文字幕亚洲视频| 四虎国产精品免费观看| 欧美色综合一区二区三区| 久久伊人资源站| 亚洲美女福利视频网站| 91亚洲男人天堂| 欧美黑白配在线| 免费国产在线视频| 天堂√在线观看一区二区| 中文字幕久久精品| 国产精品高潮呻吟| 成人影院在线| 超碰最新在线| 久久综合久久久久| 91tv亚洲精品香蕉国产一区7ujn| 欧美视频在线观看免费| 理论电影国产精品| 成人午夜大片| 国产精品二线| 国产精品一区二区免费在线观看| 日av在线播放中文不卡| 欧美一级黄色大片| 中文字幕的久久|