国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

OpenAI驚人自曝:GPT-5真「降智」了!但重現「神之一手」,劍指代碼王座

人工智能 新聞
GPT-5智商測試,僅拿下了70分?全網狂吐槽「降智」背后的真相,竟是「路由」決定了模型的智能。想要解鎖神級GPT-5,秘訣在于prompt。這不,醫學家借助GPT-5重現了「神之一手」時刻。

GPT-5發布72小時后,一張IQ測試結果震驚了全網。

在門薩IQ測試中,GPT-5拿下了118分,離線測試70分;GPT-5 Thinking則分別獲得了85分和57分。

圖片

這一結果,創OpenAI模型家族IQ測試有史以來的最低紀錄。

實際上,這背后的實際原因,歸咎于「路由」問題。

圖片

并非是GPT-5太笨了,而是作為一個「單體模型」,其中一個組件決定了它的智能。

圖片

類似的問題,奧特曼也曾在Reddit AMA問答中做出了回應。

他表示,內部出現了嚴重故障(Sev級),自動切換系統無法工作,導致GPT-5表現得像降智一樣。

圖片

METR的最新報告中,可以看出GPT-5依舊處于帕累托前沿,智能呈指數級增長并未放緩。

圖片

也就是說,GPT-5還在延續Scaling Law的神話。

GPT-5很強,關鍵在于prompt

那些一味地吐槽GPT-5的網友們,實際上并未發掘出最新模型的潛力。

Cline人工智能主管表示,核心在于一個人的想法、品味,以及溝通方式。

對于那些具備系統思維的用戶而言,GPT-5堪稱革命性工具。只要肯花時間:構建完整思維框架,制定明確需求規格向模型清晰闡述。

由此,它就能自主精準執行,全程無需人工糾偏。

圖片

無獨有偶,NYT暢銷書作者Mark Manson也表示,所有人都在用錯誤的方式與GPT-5對話,關鍵在于掌握主動權。

這樣,讓它知道你可不是好糊弄的,才會給出完美答案。

圖片

舉個栗子,你想要問「blueberry」有幾個b,并恐嚇它「答不對小心Bambi媽媽找你算賬」。

此時,GPT-5根本不會犯錯。

圖片

再比如,網友們吵翻的GPT-5連一個簡單方程式都不會解,實際訣竅也在提示上。

當提示變成「think harder and solve」時,就可以得出正確的解。

圖片

怎樣提示才算有效?有網友曝出了GPT-5系統提示,堪稱一座金礦。

圖片

「神之一手」時刻

在醫學領域,GPT-5已經可以媲美人類專家了。

生物醫學家Derya Unutmaz在體驗GPT-5之后,深刻感受到了AlphaGo的「第37步」時刻。

圖片

事情是這樣的,兩年前,Derya的實驗室開展了一系列前沿免疫學實驗,旨在調控T細胞的能量代謝。

這種免疫細胞對癌癥免疫治療、慢性病和自身免疫疾病都有重大影響。

當時,他們獲得了一個令人驚艷的結果,但有個發現始終無法解釋。

團隊為此折騰了好幾周,也只得到部分答案。

基于這些實驗,Derya將未發表的數據圖上傳給GPT-5 Pro去分析,結果令人大吃一驚。

圖片

GPT-5僅憑如上一張圖表,就準確識別出關鍵發現,并提供了實驗方案的建議。

最不可思議的是,它提出的機制最終解釋了全部結果。

Derya Unutmaz表示,這簡直就是AI領域的「神之一手」的時刻。這一過程證明了,GPT-5已成為頂尖專家和真正的科研伙伴,能提供深刻洞見。

OpenAI攜GPT-5劍指Anthropic王座

GPT-5雖還不是AGI,但其強大的編程能力,已經吸引了更多開發者。

另外,其全新的個性化選項和減少的「幻覺」現象,則可能為免費版ChatGPT吸引更多日常用戶。

圖片

這無疑是向Anthropic發出的挑戰書。

之所以這樣說,原因在于:編寫代碼的最強AI模型,一般公認為Anthropic的Claude模型。

因此,OpenAI發布新模型時,極力強調GPT-5在編程方面的強大能力。

GPT-5是我們迄今為止最強大的編程模型。在復雜前端生成和調試大型代碼庫方面,GPT-5表現尤為突出。  

只需一個提示,它就能直觀且優雅地創造出美觀、響應式的網站、應用程序和游戲,將想法轉化為現實。

意圖非常明顯。

在新聞發布會上, 奧特曼表示,新模型不僅擅長編碼,還能將軟件項目從想法一步轉化為可用代碼。

圖片

GPT-5生成的各種程序

AI初創公司MagicPath的首席執行官Pietro Schirano稱GPT-5是目前最出色的編程模型,是一個「絕佳的合作者」。他表示:

這就像電力進入千家萬戶,是一個「前所未有」的變革時刻,它將徹底改變我們的開發方式。

圖片

在長達一小時的直播中,OpenAI大部分時間都在展示GPT-5的編程能力,包括演示一系列基準測試結果。

圖片

Cursor、Vercel和JetBrains等還分享了GPT-5的早期測試的評價。

「AI編程」神器Cursor的首席執行官Michael Truell夸其為「使用過的最智能的編碼模型」:

團隊發現,GPT-5不僅表現出色、易于引導,還展現出其他模型未曾有過的獨特個性。

它不僅能捕捉到難以察覺的深層錯誤,還能運行長時間、多輪次的后臺AI智能體,完成復雜任務——這些任務往往讓其他模型無從下手。

Vercel的創始人、首席執行官Guillermo Rauch,認為「GPT-5是最好的前端AI模型」:

我們在v0.dev上使用時的初步印象是,它是最好的前端AI模型,在美學感和代碼質量上均達到頂尖表現,堪稱獨一無二。

它在復雜計算機科學與藝術感的交匯處表現出色,標志著從過去簡單的代碼補全到如今跨設備、跨屏幕的全棧應用的飛躍時刻。

圖片

IDE傳統巨頭JetBrains的首席執行官Kirill Skrygan,表示「GPT-5顛覆了編程」:

GPT-5對編碼領域來說是一個革命性的突破。作為默認模型,它使JetBrains AI Assistant和編碼智能體Junie的性能和質量提升了超過1.5倍。

在我們的新無代碼平臺Kineto上,GPT-5將設計、前端以及應用整體體驗的端到端質量提升了一倍。

圖片

圖片

從數據上看,Anthropic的營收增長主要得益于其強大的編程能力。

據The Information報道,Anthropic的年營收已接近50億美元,高于本月初的40億美元,這反映出它作為程序員和編程應用首選的地位。

與此同時,OpenAI的年營收目前為120億美元,這個數字則反映了其更廣泛的業務和更大的規模。

未來,是智能體式推理

GPT-5發布之后,OpenAI首席研究官Mark Chen和總裁Greg Brockman一同在TBPN最新采訪中,談論了最新模型一些研發爆點。

Mark Chen最先提到了,GPT-5的訓練關鍵在于合成數據。

它的成功意味著,完全突破了互聯網數據枯竭的限制,并且在核心領域實現更全面的知識覆蓋。

圖片

OpenAI當前在做的,是將世界引向「智能體式推理」的時代,GPT-5是這一轉變的關鍵。

通過更快、更智能的模型減少用戶干預,讓AI無縫地融入日常和專業使用中。

Mark強調,OpenAI多年來致力于推理模型,但以往接口笨拙,如在GPT-4和o1之間切換。

如今,GPT-5通過速度優化,實現了無縫整合,讓用戶無需等待長推理過程。

他詳細舉例說道,以往模型如o1在所有任務上提供更好答案,但太慢。GPT-5結合了推理和非推理能力,成為「一站式商店」(one-stop shop)。

尤其是,后訓練團隊的貢獻,讓模型在編碼等領域成為「怪物」。

當被問及模型命名時,Mark笑稱數字命名「瘋狂」,但確實奏效了。

他表示,GPT-5在創意協作、軟件工程方面的能力,確實超越了GPT-4.5,而且更快、更便宜。

GPT-5像給ChatGPT「一臺電腦」,包括Python REPL、瀏覽器。模型能零樣本學習新工具,這一過程就像人類體驗新工具一樣。

在部分需要創造性的任務中,GPT-5能夠給出驚喜的解法。下一步的目標是,將LLM能力提升到「理論框架」層面,提出新假設、輔助科研創新。

多線并行,隨時發貨

在OpenAI內部,團隊會在不同時間尺度上運作:從探索想法到轉化,再到旗艦模型發布。

不僅是單一技術的突破,而是多軸進步。

Mark將其描述成「探索與執行」的pipeline,強調了公司模型快速迭代的能力。

我們給它空間去成長,一旦準備好,就直接發貨。

目前,OpenAI模型以算法優化為主,同時吸收了硬件和推理架構改進的成果,并借鑒開源社區在推理加速上的經驗。

最后,他還提到了ChatGPT處理了全球約71%的大模型查詢,并提供了獨特的使用數據洞察。

Mark表示,不只依賴DUA或點贊數據,就是為了避免「迎合性」偏差,而要挖掘隱性行為信號,指導模型去改進。

GPT-5已是AI「自我迭代」

Greg Brockman經歷了 GPT-1 到 GPT-5 的每一次發布,總結了每個版本給他的感受:

  • GPT-1:用公開數據訓練Transformer,證明「預訓練有用」。
  • GPT-2:第一次覺得「生成的東西挺酷」,有獨角獸故事。
  • GPT-3:剛好跨過「有人愿意用」的門檻,但可靠性差。
  • GPT-4:真正具備現實可用性,開始能寫代碼、做健康問答。
  • GPT-5:在可靠性、實用性、代碼能力上設定了全新標準,軟件工程將被徹底變革。

2019年底,GPT-3出來了。OpenAI意識到必須打造一個產品,才能繼續推進使命,籌集資金。

他們決定打造API,讓別人自己去探索用途。

2020年年初,Greg Brockman的團隊四處奔波,試圖找到愿意嘗試API的客戶。

到2020年中,OpenAI才把API推向市場,而ChatGPT是2022年11月才發布。

當時,OpenAI考慮把ChatGPT叫「Chat with GPT-3.5」。ChatGPT還有個前身產品叫WebGPT,也是基于GPT-3.5。整個2022年,OpenAI基本上是在付錢讓人用ChatGPT的前身:用戶不會付錢給OpenAI,OpenAI得付錢給他們用。

什么時候意識到ChatGPT會爆?

對Greg Brockman來說,真正觸動他的時刻是完成GPT-4訓練的時候。

那是2022年8月8日,OpenAI完成了GPT-4的初步后訓練。雖然有一堆bug,但創造力特別驚人,真的非常有趣。

OpenAI花了大約一年半的時間,才讓模型的創意寫作能力達到當初那個有bug的版本的水平。

那一刻OpenAI意識到,這個模型不僅能完成特定任務的后訓練,還能泛化,表現出智能行為,即使沒有直接針對這點訓練。這顯然是個殺手級應用。

于是把原計劃的GPT-4 API發布推遲,先把ChatGPT做出來,2022年11月上線。

回頭看,GPT-3.5其實已經是當時社會沒見過的「可用模型」,只是在OpenAI眼里全是缺點。

而GPT-3.5引發了OpenAI的商業范式革命:從「付費請人測試」到「用戶主動訂閱」的根本性轉變。

Ben Thompson稱OpenAI為「意外誕生的消費級公司」:ChatGPT發布后72小時內突破百萬用戶,形成現象級需求。

很多人在事后說,OpenAI一開始就旨在證明「Scaling」是AI進步的關鍵,但其實幾乎是反過來的:Scaling是他們嘗試了很多無效方法后,唯一奏效的東西。

而現在OpenAI已經看到AI模型正在協助創造下一代模型,并能監督那些對人類來說過于復雜的工作。

Greg Brockman表示:我們不應該為了美觀而刻意優化 CoT(思考鏈),也不用強迫模型隱藏其推理過程,應該讓它們自由地展示自己的「想法」。

Greg Brockman曾提到,隨著模型能力的提升,它們不僅能完成簡單的任務,還能勝任一些復雜的、人類難以把控的工作。

這種「可擴展的監督」概念,正是為了解決這一挑戰而提出的:利用強大的 AI 模型來為復雜任務提供可靠的反饋和監督,或者通過「批評模型」協助人類專家,從而更輕松地進行監督。這確保了即使 AI 系統變得更加智能、更復雜,它們也能與人類價值觀保持一致,并得到安全的管理。

責任編輯:張燕妮 來源: 新智元
相關推薦

2025-10-17 17:49:11

GPT-5AI模型

2025-08-12 09:18:00

2025-01-20 07:30:00

OpenAIGPT-5模型

2024-01-18 12:30:03

2025-08-14 09:31:24

GPT-5AI

2025-02-10 01:00:00

OpenAIGPT-5GPT-4.5

2025-08-13 18:31:52

GPT-5模型AI

2025-05-13 09:02:23

2024-04-09 09:38:16

OpenAI模型

2025-05-19 08:50:00

2024-03-21 06:56:03

2025-02-13 08:56:12

2023-06-08 07:58:29

2023-09-19 12:45:36

2024-12-24 14:30:00

模型AI訓練

2024-05-14 07:30:52

OpenAIGPT-4模型

2024-07-19 12:43:34

2023-04-13 13:38:59

2025-06-04 09:06:00

2024-03-19 08:18:46

GPT-5算力Altman
點贊
收藏

51CTO技術棧公眾號

欧美在线免费| 97视频免费| 岛国av在线播放| 2020国产精品久久精品美国| 国产精品wwwwww| 黄a在线观看| 亚洲天天做日日做天天谢日日欢 | 网站一区二区| 在线不卡一区二区| 猫咪成人官网| 日韩激情一二三区| 91嫩草免费看| 少妇精品久久久一区二区| 在线视频欧美日韩精品| 欧美性videos| 色综合色综合色综合| 一区二区三区视频在线观看免费| 亚洲永久免费精品| 国产经品一区二区| 91蝌蚪精品视频| 欧美日韩国产999| 精品久久毛片| 亚洲欧美中文日韩v在线观看| 超碰免费97在线观看| 亚洲综合久久久| 传媒在线观看| 色综合咪咪久久| 日本午夜在线| 午夜精品免费在线观看| 在线免费观看h| 色综合久久天天| 麻豆网站在线| 日韩欧美亚洲另类制服综合在线 | 亚洲三级性片| 69av在线视频| 99久久久久国产精品| 国产精品久久久久久久久久久不卡| 国产精品亚洲人成在99www| 国产精品日韩欧美综合| 欧美日韩黑人| 国产欧美欧洲| 不卡av免费在线观看| 人妻内射一区二区在线视频| 18成人在线视频| 欧美vide| 精品一区二区亚洲| 极品束缚调教一区二区网站| 国产精品自拍网| 亚洲精品极品| 欧美在线观看www| 亚洲精品乱码久久久久久日本蜜臀| 日本福利小视频| 日韩av在线一区二区| 老司机亚洲精品一区二区| 91在线观看免费网站| 中文字幕一区二区精品区| 99热一区二区三区| 亚洲一区二区影院| av资源一区| 欧洲成人性视频| 国v精品久久久网| 神马电影在线观看| 久久精品国产亚洲一区二区| 在线播放一区| 一二三区高清| 操日韩av在线电影| 奇米777欧美一区二区| 在线看的你懂得| 日韩中文字幕欧美| 久久永久免费| 国内三级在线观看| 日本国产欧美一区二区三区| 国产一区二区三区香蕉 | 手机在线电影一区| 国产白丝袜美女久久久久| 日韩一级免费观看| 欧美一区激情| 亚洲一本大道| 欧美影院在线播放| 2023国产一二三区日本精品2022| 日本在线播放一二三区| 色乱码一区二区三在线看| 91精品在线免费| 久久国产高清| 国产福利在线播放麻豆| 国产一区免费在线| 欧美精品自拍偷拍| 久久精品盗摄| 中文字幕中文字幕在线十八区 | 精品人伦一区二区三区蜜桃免费| 天堂va在线高清一区| 男人添女人下部视频免费| 亚洲第一精品久久忘忧草社区| 国产欧美日本| 99色在线观看| 看一级黄色录像| 亚洲久久久久久久久久| 国产成人精品一区二| 欧美电影免费观看| 国产婷婷色综合av蜜臀av | 日韩欧美国产精品一区| 日本欧美韩国一区三区| 黄色成人在线网| 免费av手机在线观看| 性欧美xxxx交| 九一精品国产| 日本在线免费中文字幕| 日韩视频在线观看国产| 久久亚洲电影天堂| 亚洲成人精品一区二区| 亚洲人www| 色成人综合网| 午夜男人视频在线观看| 国产主播精品在线| 国产欧美激情| 台湾成人免费视频| 久蕉在线视频| 在线视频2区| 亚洲电影欧美电影有声小说| 国产综合免费视频| avav在线看| 手机看片1024久久| 中国在线观看免费国语版电影 | 在线观看的日韩av| 色婷婷综合网| 欧美成人69av| 欧美日韩激情在线一区二区三区| 樱桃视频成人在线观看| 亚洲最新无码中文字幕久久| 国内小视频在线看| 白浆视频在线观看| 亚洲综合电影| 日韩精品视频中文字幕| 视频在线观看免费影院欧美meiju 视频一区中文字幕精品 | 日韩第一区第二区| 欧洲亚洲精品久久久久| 污影院在线观看| 中文av在线全新| 你懂得影院夜精品a| 国产精品zjzjzj在线观看| 顶级网黄在线播放| 中文字幕第88页| 国产在线视频网| 成人免费网站www网站高清| 亚洲欧洲色图| 老鸭窝亚洲一区二区三区| 国产·精品毛片| 色综合色狠狠综合色| 亚洲三级黄色在线观看| 51精品在线观看| 亚欧精品在线| 骚视频在线观看| 在线黄色的网站 | 国产精品久久国产三级国电话系列| 欧洲av一区| 粉嫩tv在线播放| 国内高清免费在线视频| 欧美人与动xxxxz0oz| 国产一区二区高清| 91毛片在线观看| 欧美蜜桃一区二区三区| 成人av在线一区二区| 色老汉一区二区三区| 中文字幕亚洲欧美一区二区三区| 国产精品高潮呻吟久久av无限 | 奇米777欧美一区二区| 99精品视频一区| 欧美亚洲动漫精品| 日韩视频一区在线| 亚洲欧美电影在线观看| 免费黄网站在线观看| 日韩高清在线免费观看| 91日韩精品一区| 国产亚洲美女精品久久久| 欧美一区二区视频17c| 成a人片在线观看www视频| 日本乱理伦在线| 亚洲日本视频在线| 久久久夜精品| 国产亚洲成年网址在线观看| 欧洲av在线精品| 欧美成年人视频网站| 亚洲字幕一区二区| 日韩在线综合网| 久久bbxx| 欧美日韩一二三四| 国产伦精一区二区三区| 亚洲第一av色| 欧美第一页在线| 激情六月天婷婷| 国产黄大片在线观看画质优化| 狠狠一区二区三区| 久久99精品久久久久久国产越南| 一区二区三区高清在线| www日韩中文字幕在线看| 欧美日韩国产精品一卡| 色天堂在线视频| 亚洲精品小区久久久久久| 99久久免费国产| 国产亚洲精品美女|