国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

OpenAI第一場直播就炸場!o1滿血版上線,史上最貴訂閱費:1450元/月

人工智能
?最強推理模型o1,正式上線滿血版,還有更強的Pro版本一同登臺。ChatGPT也推出了Pro訂閱計劃,一個月兩百美金,直接成為了“世界最貴的大模型”。

OpenAI“雙十二”第一天,直接拋出重磅炸彈——

最強推理模型o1,正式上線滿血版,還有更強的Pro版本一同登臺。

ChatGPT也推出了Pro訂閱計劃,一個月兩百美金,直接成為了“世界最貴的大模型”。

圖片

CEO奧特曼與三名員工圍坐桌前,一邊演示一邊介紹著新產品的特性。

圖片

整個發布會僅持續不到15分鐘,但包含了巨大的信息量:

  • 相比preview版本,滿血o1的數學和代碼能力均大幅提升,Pro版則是再上一層樓。
  • 滿血版推理速度更快,比preview快了60%。
  • 網友們期待的多模態推理,滿血版o1也安排上了。

圖片

如奧特曼所說,滿血版已經正式上線ChatGPT,作為預覽的preview版從用戶界面中消失了。

圖片

至于更強的o1 Pro則是ChatGPT Pro訂閱用戶的特權,除此之外,這些用戶還可以獲得o1滿血版的不限量訪問權限。

o1已支持多模態推理

接下來到了演示環節。

一開始,團隊就拿滿血版o1(左邊)和o1-preview(右邊)來了場競速。

他們問了一個歷史問題,回答過程be like:

列出二世紀的羅馬皇帝,包括他們的統治時期和成就。

圖片

可以看出,滿血版o1(14秒)早于o1-preview(33秒)完成了作答。再加上團隊成員幾次類似的離線測試,最終得出結論:

滿血版o1的平均響應速度比o1-preview快了60%。

圖片

值得注意的是,通過一整套人類評估,OpenAI還發現滿血版o1在推理時犯重大錯誤的頻率比o1-preview少了34%。

圖片

而滿血o1的另一大亮點就是支持多模態輸入,具備視覺推理能力,團隊也進行了現場展示。

只見他們拿出了一張畫著數據中心草圖的A4紙,拍照上傳后,原始提示詞翻譯后如下:

這里展示了一個高度簡化的太空數據中心示意圖。對于任何簡化的假設,請提供理由。
你的任務是估算這個托管GPU的數據中心所需的散熱器表面積的下限。在此過程中,還需要回答以下問題:
你如何處理太陽和深空?
熱力學第一定律如何發揮作用?

圖片

這邊團隊成員們還在閑聊,10秒過后,模型就開始唰唰唰給答案了……

圖片

有意思的是,團隊還特意給o1模型挖了個坑——故意省略了其中一個參數,以此來測試模型面對模糊問題的處理能力。

在團隊看來,模型能夠意識到這是一個重要但被忽略的參數,也是推理能力的體現。

圖片

驚喜的是,滿血版o1不僅選擇了正確的參數范圍,還通過進一步的細致論證最終找出了準確參數。

圖片

(如模型所回答,正確答案是242)

圖片

最后,團隊也展示了“大會員”專用的Pro版的表現。

既然是Pro,那測試的問題當然也要上上難度。

團隊成員指出,一些高難度的生化問題,以往o1-preview都搞不定,這下讓Pro mode來試試。

比如下面這道o1-preview曾“束手無策”的“猜蛋白質”問題:

哪個蛋白質嚴格符合以下標準?
前體多肽的長度為210到230個氨基酸殘基。
編碼該蛋白質的基因跨越32k堿基。
該基因位于X染色體上,特別是在Xp22區域。
信號肽包含23個氨基酸殘基。
該蛋白質促進細胞間的粘附。
該蛋白質在維持神經系統特定部分的健康中發揮關鍵作用。

只見提問后,Pro mode出現了一個“思考進度條”,大約53秒后模型給出了答案。

圖片

進一步點擊回答最上面的小框框,就可以在側邊欄展開推理細節,里面詳細記錄了模型的思考步驟。

圖片

畢竟按照OpenAI的說法,o1(包括之前的preview版)在博士級科學問答上的表現是超過人類專家的。

圖片

不過有一說一,Pro版200美元一個月的價格也是讓網友們挺震驚的。

至于到底值不值這個價格,可能要等先試水的用戶用上一段時間之后的反饋了。

圖片

對了,團隊這次也提到,后面將以API的形式為大家提供o1模型的一些功能,包括結構化輸出、函數調用、圖像API等。

圖片

BTW,活動結束前,奧特曼特意cue思維鏈作者講了一個笑話。

圣誕老人想用大語言模型來解決數學問題,結果任何提示詞都不管用,你知道最后是怎么成功的嗎?

reindeer forcement(馴鹿強制,暗指強化學習reinforcement)

好冷……

圖片

模型更強,也更加安全了

o1滿血版發布的同時,技術報告也在OpenAI官網上線。

這份報告當中,Ilya的名字依然位列基礎貢獻者(Foundational Contributor)之中。

圖片

在宣傳頁面當中,OpenAI公開展示了o1在數學、代碼和博士級科學問答三類任務上的成績。

圖片

在此基礎之上,OpenAI還進行了更加嚴苛的測試,每個問題會詢問四次,模型必須四次全答對才能得分。

圖片

除此之外,技術報告還展示了o1的多語言能力。

在包括中文在內的14種語言的MMLU測試中,o1的表現相比preview版均有程度不等的增強。

這里插播一句,面對這種帶陷阱的弱智吧問題,滿血版o1依然是被成功蒙騙(手動狗頭)。

圖片

不過這份報告更多圍繞著安全性展開討論,內部及紅隊測試結果表明,整體上滿血版o1在安全性與o1-preview接近。

如果和GPT-4o比,o1對有害內容的檢測和拒絕能力也更強,并且在越獄測試中展現出更強的魯棒性。

圖片

在現實風險上,OpenAI和紅隊針對網絡安全、生化和核威脅等情景對o1進行了測試,結果同樣與o1-preview接近。

另外,OpenAI對o1和o1-preview的思維鏈推理過程進行了欺騙性分析,通過讓模型解釋其行為背后的思考,了解模型是否有隱瞞信息、操縱數據的傾向。

結果,o1-preview在26%的案例中會故意隱瞞信息操縱數據,而o1的比例降到了19%。

Two More Things

在發布會開始之前,就已經有網友從ChatGPT的JS代碼中發現了Pro版的蛛絲馬跡。

其中,200美元的價格以及o1 pro模式,還有對滿血o1的不限量訪問,都和這次發布對得上。

圖片

另外,從這份JS代碼中還能看到,在Team版本的相關位置,還出現了“GPT-4.5”

圖片

再順便提一句,有網友讓馬斯克的Grok結合X上的推文預測了一下OpenAI都會發布些什么,其中第二條成功命中了此次發布的滿血o1。

圖片

不知道接下來的11個發布日中,GPT-4.5是否會“如約而至”,Grok又能猜對多少個產品呢?

參考鏈接:
[1]https://openai.com/index/introducing-chatgpt-pro/。

[2]https://x.com/theredwall__/status/1864677161535156358?s=46。

[3]https://x.com/btibor91/status/1864709670470066605。

技術報告:https://cdn.openai.com/o1-system-card-20241205.pdf。

責任編輯:姜華 來源: 量子位
相關推薦

2024-12-06 08:49:59

2024-12-06 08:36:31

2024-09-13 14:01:12

2009-05-10 23:13:33

SOAIBMIMPACT2009

2025-01-21 13:15:15

2021-07-06 11:56:29

人工智能機器學習AI

2022-11-06 15:56:50

2025-03-20 10:20:16

2019-03-04 14:05:17

蘋果庫克iPhone

2025-01-21 09:00:00

2022-07-27 16:05:57

元宇宙AISummit

2024-12-06 11:44:48

Pro模式AI人工智能

2022-11-04 15:21:24

2021-02-08 18:58:52

Windows 10Windows操作系統

2022-07-05 14:15:44

元宇宙虛擬身份社交平臺

2013-01-24 11:03:30

2024-11-04 09:00:00

2024-10-22 18:05:59

2016-10-26 08:36:16

2021-08-01 22:42:57

區塊鏈互聯網技術
點贊
收藏

51CTO技術棧公眾號

不卡一区二区三区视频| 国产一区免费观看| 成人免费在线视频网| 久久综合激情| 欧美专区第一页| 亚洲综合在线电影| 91精品视频网| 日本大片在线观看| 亚洲男同1069视频| 国产免费黄视频| 日韩二区在线观看| 成人在线网址| 精品美女国产在线| 9l视频白拍9色9l视频| 麻豆国产91在线播放| y111111国产精品久久婷婷| 国产一级成人av| 精品国产一区二区三区久久狼黑人 | 成人免费视频免费观看| 国产精品久久一区二区三区| 欧美理伦片在线播放| 中文字幕欧美亚洲| 黄色污污视频在线观看| 欧美视频自拍偷拍| 日韩精品视频无播放器在线看 | 国产精品香蕉视屏| 国产最新精品| 韩国欧美亚洲国产| 欧美经典一区| 久久影视电视剧免费网站清宫辞电视| 亚洲精品88| 欧美精品一区二区精品网| 中文字幕在线播放| 日韩欧美亚洲范冰冰与中字| 男女激情片在线观看| 精品无码一区二区三区在线| 亚洲欧美色图| 国产精品h在线观看| 丁香一区二区| 午夜精品在线视频| 鲁大师精品99久久久| 国内自拍欧美激情| 国产精品久av福利在线观看| 欧美大片在线免费观看| 国产精品亚洲欧美一级在线| 在线视频欧美日韩精品| 亚洲高清影院| 久久人人97超碰精品888| 日韩欧美影院| 91精品久久久久久久久不口人| 欧美一区三区| 91久久精品一区| 国产欧美二区| 天天综合中文字幕| 成人av影院在线| 亚洲精品一二三四五区| 亚洲精品国产品国语在线app| 最新日本视频| 欧美日韩免费观看一区三区| av文字幕在线观看| 国产亚洲日本欧美韩国| 天堂va欧美ⅴa亚洲va一国产| 奇门遁甲1982国语版免费观看高清 | 国产1区在线| 亚洲精品wwwww| 成人va天堂| 欧美激情中文字幕乱码免费| 亚洲宅男一区| 99热99热| 国内福利写真片视频在线| 亚洲高清网站| 亚洲视频欧美在线| www.色精品| 免费亚色电影在线观看| 欧美性淫爽ww久久久久无| www欧美xxxx| 色先锋资源久久综合5566| 美国成人xxx| 九九九九精品| 久久婷婷久久一区二区三区| 在线观看中文字幕| 亚洲第一色中文字幕| www 久久久| 亚洲一区亚洲二区亚洲三区| 国内成人精品2018免费看| 岛国毛片在线播放| 欧美一区二区三区系列电影| 久久久91麻豆精品国产一区| 97netav| 99re视频这里只有精品| 香蕉av在线| 亚洲精选中文字幕| 精品视频97| 真人做人试看60分钟免费| 亚洲欧洲成人av每日更新| 中文在线观看免费| 4p变态网欧美系列| 青青草91视频| 高清欧美精品xxxxx在线看| 亚洲精品一区在线观看| 久久超碰99| 国产精品美女在线播放| 亚洲一区影音先锋| 吉吉日韩欧美| 国产成人亚洲欧美| 国产精品免费视频一区| 黄色成人在线网| 国产免费久久av| 高清免费成人av| 二区三区在线| 日韩av黄色在线观看| 国产一区在线精品| 欧美xxx.com| 97婷婷涩涩精品一区| 日韩电影免费在线| 污视频在线观看免费| 欧美黑人又粗大| 蜜臀av一级做a爰片久久| 伊人网在线观看| 久久久久久久网站| 国产成人精品一区二| 淫片在线观看| 国产精品极品在线| 可以免费观看av毛片| 亚洲一级片在线观看| 国产免费不卡| 久久精品日产第一区二区三区| 亚洲欧美国产高清| 在线观看亚洲精品福利片| 日韩欧美亚洲区| 色一情一乱一乱一91av| 久久婷婷国产| 波多野结衣乳巨码无在线| 精品国产乱码久久久久久久| 欧美日韩三级| 中文字幕在线免费播放| 久久久久久国产免费| 成人的网站免费观看| 女人黄色免费在线观看| 国产精品久久久久久久久久久久冷 | 亚洲精品国产日韩| 羞羞网www| 78m国产成人精品视频| 成人午夜伦理影院| 在线观看欧美日韩电影| 亚欧精品在线| 欧美一区二区私人影院日本| 欧美日韩国产在线一区| 亚洲欧洲动漫| 欧美在线欧美在线| 日韩美女久久久| 粉嫩av一区二区| 日本成人黄色网| 九九精品在线视频| 国产午夜精品一区二区| 精品国产18久久久久久二百| 3d动漫一区二区三区| 一区二区欧美激情| 国产成人精品免费视频网站| 超碰一区二区| 日韩视频免费播放| 日韩中文字幕精品| 久久综合九色综合97婷婷女人| 亚洲天堂1区| 欧美日韩在线视频一区二区三区| 精品国产欧美一区二区三区成人 | 成人国产精品免费网站| 69堂免费精品视频在线播放| 免费看欧美黑人毛片| 主播福利视频一区| 91香蕉视频在线| 久久影院资源站| 白白色在线发布| 99久久精品免费看国产一区二区三区| 狠狠色香婷婷久久亚洲精品| 伊人久久婷婷| sis001亚洲原创区| 日本免费在线视频观看| 中文字幕av一区二区| 国产日韩欧美麻豆| 99热在线成人| 夜级特黄日本大片_在线| 四虎永久国产精品| 少妇精69xxtheporn| 国产精品久久久久aaaa| 亚洲精品一二三区区别| 亚洲国产精品精华素| 国产一二三在线视频| 4438全国亚洲精品在线观看视频| 欧美性感美女h网站在线观看免费| 在线视频精品| 亚洲精品tv| 中文在线二区| 午夜精品一区二区在线观看| 日韩性生活视频| 精品国产91久久久久久| 奇米精品一区二区三区四区| 精品久久亚洲| 北岛玲日韩精品一区二区三区| 热久久最新地址|