国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

GPT-5降臨,代號獵戶座?OpenAI疑用草莓訓練,數學推理暴漲超越所有模型

人工智能
OpenAI又憋大招了!據悉,下一代旗艦模型GPT-5或名為「獵戶座」,由「草莓」合成的數據訓練。而草莓具有極強的復雜推理(數學、編程)和語言能力,或將超越當前的任何模型的推理和生成的能力。

OpenAI的下一代旗艦大語言模型,要來了?

據悉,新模型代號Orion(獵戶座),就是能超越GPT-4的下一代模型。

而獵戶座的預訓練數據,正是由草莓模型生成的。

而草莓模型驅動的聊天機器人,很可能就會在今年秋天上線!

關于OpenAI的草莓,外媒The Information最近又挖到了新的細節。

圖片圖片

根據The Information的信息,網友推測:「GPT-4+草莓」會在秋季推出,之后上線的繼任者「獵戶座」可能就是GPT-5。

圖片圖片

圖片圖片

由于大概率要避開11月,因此,獵戶座的發布時間要么在之前要么是在12月。

圖片圖片

甚至,AI大V、Hallid.ai聯創「indigo」提出了一個大膽的猜測:獵戶座或許不是GPT-5,而是GPT-6。

圖片圖片

AI大V「Chubby」表示附議。

圖片圖片

最后,Chubby激動地表示:所有人都覺得AI的發展正在放緩?并不是。在大公司,廚房里的東西正在沸騰!

圖片圖片

網友們紛紛表示:「我們正在見證一種超越我們自己思想的誕生」。

圖片圖片

打開Q*之門,一切模型憑此迭代。

圖片圖片

圖片圖片

有人擔心,如果GPT-5控制整個互聯網,人類會從此迷失。

圖片圖片

所以,獵戶座到底是GPT-5還是GPT-6呢?網友們各持己見。

但有人猜測,我們目前還沒有足夠的算力來達到GPT-5,更不用說GPT-6了。

圖片圖片

透個底,讓美國政府安心

此前,關于草莓的傳聞早已滿天飛。

圖片圖片

今年夏天,Sam Altman的團隊已經向美國國家安全官員展示了這項技術。

在安全問題日益敏感的情況下,OpenAI的做法也算給大家打了個樣。

如果政府官員覺得這項AI不安全怎么辦?那就給他們展示一下。

這次演示,就是OpenAI讓政策制定者覺得更透明的努力的一部分。畢竟,如果他們感覺到受到這項技術的威脅了,很可能就會給公司帶來麻煩。

圖片圖片

現在,OpenAI的安全團隊已經出走,憤怒的前員工在網上大肆爆料,這種時候,對政府官員更加透明的做法,就顯得尤為重要。

The Information表示,這次演示還可能另有目的:跟政府隊員就如何保護技術進行對話,以防止美國的AI技術被他國竊取。

說不定,還可以借此機會攻擊Meta一波,因為他們的AI是開放權重的,其他國家想要獲取,是非常容易的事。

總之,未來幾年內,AI開發者應該會經常出現在舊金山和華盛頓之間的航線上了,因為他們時不時就需要跟政府官員來往一下。

草莓:數學提升,能解字謎

一個月前路透社曾報道,OpenAI內部測試了一種AI,在MATH基準上得分超過了90%。

據猜測,這個模型很可能就是草莓。

圖片

如今的傳言是,今年秋天OpenAI研究者會推出代號為草莓的新AI(也就是之前的Q*),或許會聊天到ChatGPT之類的聊天機器人中。

它能做到目前的聊天機器人無法做到的很多事情,比如解決未曾遇到的數學問題,還能解決編程難題。

圖片圖片

在獲得額外「思考」時間后,草莓模型還可以回答更主觀的問題,比如產品的營銷策略。

據悉,在語言任務上,草莓表現出了強大的能力。比如OpenAI的一位員工曾向同事演示了草莓成功解決《紐約時報》的Connections——復雜的文字謎題。

圖片圖片

OpenAI在LLM和會話AI領域的領先地位,一直在遭受沖擊,因此OpenAI只能對外不時放出點草莓的消息,提升一下自己的存在感。

另外,據說草莓的技術已經顯示出了智能體的能力。

草莓模型似乎能夠自主瀏覽網絡,像人類研究人員一樣,獨立上網、進行深度研究。

它不僅能生成答案,還能規劃、執行一系列復雜任務,還能收集信息。

與之類似的,還有斯坦福的Quiet-STaR。

就像人類會在說話或寫作前會停下來思考自己的想法一樣,Quiet-STaR可以訓練LLM去生成在復雜推理問題中采取步驟的內部「思考」,從而做出更好的決策。

圖片圖片

論文地址:https://arxiv.org/abs/2403.09629

眼下,OpenAI的業務正以驚人的速度增長:跟去年相比,今年它向企業銷售LLM和ChatGPT訂閱的收入大約增加了三倍,達到了每月2.83億美元,盡管公司每月的虧損可能高于此。

目前,OpenAI的私人估值為860億美元。

Sam Altman還希望為公司籌集更多資金,找到減少損失的方法。

自2019年以來,OpenAI已經從微軟籌集了約130億美元,與這家企業軟件巨頭的協議,會持續到2030年。

合作條款可能會發生變化,包括OpenAI向微軟支付租用云服務器以開發AI的方式。

云服務器,是OpenAI最大的成本。

OpenAI的新希望:Orion(獵戶座)

但說到底,OpenAI的前景終究還是依賴正在開發的新旗艦——Orion。

圖片圖片

有人能解釋一下為什么OpenAI、谷歌和亞馬遜一直用希臘神話來命名他們的模型嗎?

去年初推出后,GPT-4已經被各家趕超得差不多了,現在GPT-4級的模型,可以說是各家人手一個。

有人猜,OpenAI可能會推出一個比原始草莓模型更小、更簡化的模型,也就是蒸餾版。

這個版本被寄望于提升GPT-4和ChatGPT性能,目的是保持和更大模型相同的性能水平,而且更易于操作,成本更低。

另外,還有知情人士透露,OpenAI還在用更大的草莓版本,為Orion的訓練生成數據。

這種人工合成數據,意味著草莓能幫助OpenAI克服獲取高質量數據的限制,從而可以從現實世界數據(比如從互聯網獲取的文本或圖像)中訓練新模型。

研究人員表示,使用草莓可以幫助Orion減少幻覺的產生。

這是因為,AI模型是從訓練數據中學習的,所以它們看到的復雜推理的正確示例越多,就越好。

對此,智能體初創公司Minion AI的CEO兼GitHub Copilot前首席架構師Alex Graveley給予了高度厚望。

「想象一個沒有幻覺的模型,一個你問它邏輯難題、它第一次就答對了的模型。」

「訓練數據中存在較少的歧義,因此它的猜測更少。」

The Information猜測,草莓改進的推理能力,可能會整合到ChatGPT中。這些答案可能會更準確,但也可能更慢。

因此,草莓可能并不適合需要即時即時響應的應用。而在GitHub中修復非關鍵編碼錯誤,則是理想的選擇。

或許,以后的ChatGPT用戶,可以根據請求的時間敏感性來切換草莓模型。

Sam Altman在五月的一次活動中曾表示:「我們感覺,為下一個模型準備的數據已經足夠」。

這個模型,很可能指的是就Orion。Altman表示:「我們進行了各種實驗,包括生成合成數據。」

解決復雜數學問題:有前景的應用

如果說目前AI最有前景的應用,那解決復雜數學問題,必然是其中一個了。

畢竟,現有的AI在數學密集的領域如航空航天和結構工程中,表現實在不佳。

各種LLM在回答數學問題時,往往會給出各種讓人啼笑皆非的答案。

而且,數學推理能力的提升還能幫助AI模型更好地推理會話查詢,比如用戶的服務請求。

谷歌和一些初創公司,也在這方面發力。

上個月,谷歌DeepMind開發的AI,已經能在國際數學奧林匹克競賽中擊敗大多數人類參賽者。

圖片圖片

OpenAI的另一大競爭對手Anthropic祭出的最新模型,也能編寫更復雜的軟件代碼,還能回答有關圖表和圖形的問題,這些都要歸功于它推理能力的改進。

圖片圖片

還有一些初創公司為了提高模型的推理能力,采用了一種廉價的技巧,將問題分解為更小的步驟,盡管這些方法速度慢且成本高昂。

無論Strawberry是否會作為產品推出,人們對Orion的期望都不會低了,因為OpenAI會力求繼續保持領先地位,同時還要保證顯著的的收入增長。

OpenAI的領先者優勢,已經不明顯了。

雖然在5月宣布了「Her」的版本,但谷歌卻搶先推出了AI驅動的語音助手,后者也足夠靈活,還能處理用戶的打斷,和突然變化的話題。

而Lmsys Chatbot Arena等大模型排行榜上,谷歌、xAI、Anthropic和Meta的模型也都在趕上OpenAI的步伐。

圖片圖片

Ilya看到了什么?

值得一提的是,「草莓之父」,其實就是已經離職了的OpenAI的首席科學家Ilya Sutskever。

幾年前,Ilya啟動了一個項目,在研究過程中,誕生了草莓。

而在Ilya離職之前,OpenAI的研究人員Jakub Pachocki和Szymon Sidor,就已經在Ilya的工作基礎上開發了一個新的數學求解模型Q*,這讓不少關注AI安全的研究人員感到擔憂。

另外,在去年Q*的前期準備中,OpenAI研究人員開發了一種被稱為「測試時計算」的概念變體,目的是提升LLM的問題解決能力。

這樣,LLM就會花更多時間考慮被要求執行的命令,或問題的各個部分。

當時,Ilya發表了一篇與這項工作相關的博客。

圖片圖片

博客地址:https://openai.com/index/improving-mathematical-reasoning-with-process-supervision/

在博客中,模型解決了數個有難度的數學問題。

比如在這道有挑戰性的三角函數題中,需要連續應用幾個并不明顯的等式。

圖片圖片

圖片圖片

在這道題,GPT-4成功執行了一系列復雜的多項式分解。

圖片圖片

步驟5中使用的Sophie-Germain恒等式是重要的一步,可以被認為極有洞察力。

圖片圖片

在這道題的步驟7和8中,GPT-4開始執行猜測和檢查。

圖片圖片

這也是模型可能產生幻覺的常見情況,LLM會聲稱某個特定的猜測是成功的,但實際上并不成功。

在這種情況下,獎勵模型會驗證每個步驟,并確定思路是否正確。

圖片圖片

在最后這道題中,模型成功地應用了多個三角恒等式,來簡化了表達式。

圖片圖片

圖片圖片

或許,我們能從中窺見草莓和Orion的端倪。

參考資料:

https://www.theinformation.com/articles/openai-races-to-launch-strawberry-reasoning-ai-to-boost-chatbot-business?rc=epv9gi

https://www.theinformation.com/articles/openai-shows-strawberry-ai-to-the-feds-and-uses-it-to-develop-orion?rc=epv9gi

責任編輯:武曉燕 來源: 新智元
相關推薦

2024-08-28 12:15:52

2024-12-12 00:40:07

2024-11-11 13:52:31

2023-06-08 07:58:29

2024-08-08 14:00:00

2023-04-15 19:37:50

OpenAIGPT-5

2025-08-18 17:14:41

GPT-5OpenAIAGI

2025-09-19 14:53:34

2023-11-09 12:41:04

AI模型

2023-08-08 12:51:55

AI技術

2023-08-02 00:19:46

2025-12-05 09:21:00

2025-12-01 08:57:00

2024-08-30 14:36:00

2025-08-15 14:53:43

2025-08-07 16:21:27

GPT-5AI模型

2024-01-18 12:30:03

2023-03-17 07:33:24

GPT-5GPT-4OpenAI

2025-08-11 14:13:36

OpenAIGPT-5人工智能

2025-08-21 10:11:44

點贊
收藏

51CTO技術棧公眾號

综合久久2023| 精品一区二区三区蜜桃| 欧美日韩在线三区| 虎白女粉嫩尤物福利视频| 久久久五月天| 欧美伦理91i| 中文字幕中文字幕在线十八区| 国产精品美女视频| 天堂va久久久噜噜噜久久va| 午夜视频一区二区在线观看| 精品精品国产高清a毛片牛牛| 日韩精品一区二区三区不卡 | 久久精品影视大全| 午夜欧美福利视频| 日韩精品一区二区三区视频播放| 日韩av电影免费在线| 黄色aa久久| 91免费视频网| 久久久噜噜噜久久中文字免| 日批视频在线免费看| 天天影视综合| 成人在线观看你懂的| 亚洲视频香蕉人妖| 亚洲成人高清| 国产女同一区二区| 国产九一精品| 精品久久久久久久久中文字幕| 免费av片在线观看一道本| 一区二区三区日韩精品| 91热爆在线观看| 成人av午夜影院| 337p亚洲精品色噜噜狠狠p| 日本一区二区综合亚洲| 国产免费福利网站| 国产欧美一区视频| 成人中文字幕av| 色综合久久综合中文综合网| 国产原创中文在线观看| 欧洲中文字幕精品| 天堂网在线观看国产精品| 国产精品国产一区二区| 老司机免费视频一区二区三区| 能在线观看的av网站| 91在线视频官网| 欧美极品日韩| av一区二区三区| 色佬视频在线观看| 中文字幕精品网| 色偷偷偷在线视频播放| 欧美成人精精品一区二区频| 乱亲女h秽乱长久久久| 天堂中文av| 精品亚洲国产视频| 国产国产精品| 国产视频一二三区| 国产日韩欧美激情| 蜜芽在线免费观看| av资源站久久亚洲| 国产不卡在线播放| 亚洲女优视频| 中文字幕亚洲激情| 男人的j进女人的j一区| 成年网站免费| 日本国产一区二区| 日韩五码电影| 日韩国产伦理| 国产高清视频一区| 婷婷视频在线| 欧美成人午夜剧场免费观看| 亚洲天堂网中文字| 久久综合av| 亚洲男人天堂色| 国产精品扒开腿爽爽爽视频| 亚洲日本在线a| 黄色三级在线观看| 91久久久久久久久| 亚洲国产成人一区二区三区| 成人短视频软件网站大全app| 国产精品久久夜| 97在线影院| 欧美性xxxxx极品娇小| 九九热视频在线观看| 亚洲精品av在线| 国产成人精品亚洲线观看| 国产精品免费视频久久久| 在线免费高清一区二区三区| 久久久99精品视频| 午夜激情综合网| 成人在线高清免费| 色综合久久88色综合天天看泰| 欧美色网址大全| 日韩少妇中文字幕| 国产精品美女久久福利网站| 91涩漫在线观看| 色老头一区二区三区在线观看| 国产精品中文字幕亚洲欧美| 久久综合一区| 中文欧美字幕免费| 男人资源在线播放| 欧美日韩福利电影| 午夜在线视频观看日韩17c| 久草综合在线观看| 欧美猛男男办公室激情| 欧美午夜网站| 久久久神马电影| 国产精品美女一区二区| 日韩三级免费| 国产aaa精品| 国产成人精品一区二区三区四区| 国产网友自拍电影在线 | 成人亚洲视频在线观看| 色婷婷亚洲精品| 国产精品成人3p一区二区三区| 国产精品一区而去| 中文字幕在线观看不卡视频| av资源一区| 亚洲一区二区在线| 91免费视频网址| www.久久ai| 国产精品视频午夜| av在线这里只有精品| 岛国在线视频| 欧美亚洲在线播放| 成人美女在线观看| 手机在线免费看av| 成人午夜两性视频| 国产亚洲欧洲997久久综合| 欧美韩日亚洲| 成人三级视频在线观看一区二区| 日本一区二区三区视频视频| aa视频在线观看| 成人激情电影一区二区| 久久久久久日产精品| jizzjizz亚洲中国少妇| 色偷偷av亚洲男人的天堂| 亚洲精品极品| 亚洲成人av高清| 欧洲日韩成人av| 国产亚洲欧美中文| 日韩欧国产精品一区综合无码| 椎名由奈jux491在线播放| 欧美三级三级三级爽爽爽| 欧美三级伦理在线| 免费男女羞羞的视频网站中文版| 中文字幕av日韩| 黑人巨大精品欧美黑白配亚洲| 1区2区3区在线视频| 久久久久一区二区三区| 欧美日韩免费在线视频| 女人香蕉久久**毛片精品| 色播在线视频| 成人久久久久久久| 亚洲色图20p| 色婷婷av一区二区三区丝袜美腿| 日韩精品一区二区三区不卡| 久久精品国产亚洲一区二区| av在线不卡免费看| 四虎国产精品免费久久| 久久福利一区二区| 亚洲性生活视频| 91麻豆国产福利精品| 99tv成人影院| 日韩免费毛片视频| 久久久综合免费视频| 国产精品久久久久影院老司| 国产精品极品国产中出| 亚洲熟妇av日韩熟妇在线| 亚洲一区二区黄| av亚洲精华国产精华精华 | 97久久超碰福利国产精品…| 欧美国产激情二区三区| 国产精品视屏| 三上悠亚一区| 国产综合在线观看视频| 91黄色激情网站| 一本久道综合久久精品| 制服丝袜在线播放| 在线播放豆国产99亚洲| 亚洲天堂网站在线观看视频| 成人听书哪个软件好| 亚洲国产一区二区三区在线播| 国产在线一区二区三区四区| 国产精品一区二区三区观看| 久久久www免费人成黑人精品| 欧美精品一区二区三区一线天视频 | 国产欧美自拍一区| 日韩中文字幕在线视频观看| 午夜精品久久久久久久久久久久| 国产精品不卡一区二区三区| 成人羞羞视频播放网站| 草草在线观看| h网址在线观看| www.-级毛片线天内射视视| 欧洲成人免费视频| 日韩高清免费观看| 五月婷婷综合激情| 国产黄色精品视频| 女人香蕉久久**毛片精品| 国产精品日韩精品在线播放| 免费在线观看黄|