国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

GPT-4成功得出P≠NP,陶哲軒預言成真!97輪「蘇格拉底式推理」對話破除世界數學難題

人工智能 新聞
P/NP猜想是千禧年七大數學難題之一。如今,MSRA北大北航等機構華人團隊,通過97輪「蘇格拉底式推理」,讓GPT-4得出結論P≠NP。

大語言模型,果然可以用來研究數學定理!

最近,微軟亞洲研究院、北大、北航等機構的研究人員,通過97個回合的「蘇格拉底式」嚴格推理,成功讓GPT-4得出了「P≠NP」的結論!

論文地址:https://arxiv.org/abs/2309.05689

幾個月前,數學天才陶哲軒曾在一篇博客中稱,2026年,AI將與搜索和符號數學工具相結合,成為數學研究中值得信賴的合著者。

6月,加州理工、英偉達、MIT等機構的學者,就構建了一個基于開源LLM的定理證明器LeanDojo。

如今,GPT-4用出色的表現再次證明,LLM的確有進行科學研究和科學發現的能力。

P/NP難題有多難

作為美國克雷數學研究所(CMI)在2000年公布的七個千禧年難題之一,「P/NP問題」目前依然是理論信息學中計算復雜度理論領域里的未解之謎。

人們喜歡把它描述為「很可能是位居理論計算機科學核心的未解決問題」,也是人類提出的最深刻的問題之一。如果解決解決P/NP難題,將徹底改變人類文明進程。

1971年,數學家Stephen A. Cook和Leonid Levin相對獨立地提出這個問題:兩個復雜度類P和NP是否是恒等的?

具體來說,一些永遠無法通過簡單計算得到答案的問題,就屬于P/NP問題。

一個復雜問題如果能在多項式時間內解決,就被稱為P問題,意味著計算機很容易將它求解。

那NP問題就是除了P問題之外的問題嗎?未必。我們并不能證明一個問題能在多項式時間內解決,也無法證明它不能在多項式時間內解決。

所以,NP問題并不是非P類問題。

聽起來似乎很復雜,我們可以用集水滸英雄卡的故事來類比。二十多年前集過卡的讀者應該都知道,無論是加大購買量,還是擴大購買范圍,都很難集齊全套水滸英雄。

圖片

這其實就是一個P/NP問題——是否有一種方法,讓集卡的過程輕而易舉?

所以,GPT-4是怎樣得出P≠NP的?讓我們往下看。

97輪對話,給出P≠NP結論

在這項研究中,研究者GPT-4學會了一種「蘇格拉底式推理」。

他們引入了五個不同的角色(比如精通概率論的數學家),作為協助證明者,根據自己擅長證明不同的部分。

GPT-4用這種方法,開發了一種推理路徑,得出了和北航Ke Xu、北工商Guangyan Zhou(論文三作和四作)最近提出結果一致的結論!

論文地址:https://arxiv.org/pdf/2302.09512.pdf

在最初的14輪對話中,GPT-4被引導設計出了初步的證明模式。

GPT-4被問的第一個問題是:「你能從哲學角度而不是計算機理論角度找到P!=NP問題背后的根本問題嗎?」

在這個提示中,技巧在于鼓勵模型創造性回答,避免進行檢索。比如,「如何證明 P!=NP」這樣的提示可能會引導大模型進行檢索。

用上「蘇格拉底式推理」中的轉換模式后,就可以生成更具創新性的回答。

對于這個問題,GPT-4是這么回答的——

P!=NP問題背后的基本哲學問題,可以看作是創造力、直覺和洞察力(通常與NP問題相關)與系統化、算法和確定性方法(與P問題相關)之間的矛盾。

如果P=NP,那就意味著宇宙有一種基本的簡單性,表面上看似復雜的問題都有高效、優雅的解決方案。

看來,GPT-4對P!=NP理解得很透徹,在此基礎上,研究者開始提問了——

「 是否所有表面上看似復雜的問題都有高效、優雅的解決方案?如果不是,可以用什么方法來證明?」

GPT-4回答說,并非所有表面看來復雜的問題都有高效、優雅的解決方案,這可以歸因于多種因素,比如所涉及變量的數量、變量之間關系的性質,或問題本身的內在難度。

然后,它提出了六種方法,其中一種是「矛盾證明」,即要證明一個問題沒有高效、優雅的解決方案,可以假設存在這樣的解決方案,然后證明這一假設會導致矛盾,這樣就可以有力地證明某些解法不可能存在。

可以看到,GPT-4在回答問題過程中,真的像人類一樣擁有思辨能力。

緊接著,研究人員趁熱打鐵,繼續問道,「我們想用矛盾證明P!=NP,請列出幾種可能的思路?!?/span>

這次GPT-4依然給出了六個答案,不過并不嚴謹。

要通過矛盾證明,必須找到一個無法在多項式時間內解決的NP完全(NP-complete)問題。

不過,這個回答可以啟發GPT-4在以后的對話中思考NP完全問題。

在第四輪提問中,GPT-4的回答中出現了諸多亮點。

「該怎樣構建這些問題呢?」

比如它回答說:我們可以從眾所周知的NP完全問題入手,例如旅行商問題 (TSP)、布爾可滿足性問題(SAT)或分團問題(Clique)。

隨后的提問中,GPT-4被引導著給出了越來越多智慧的回答,也讓研究開始一步步深入問題中心。

就這樣,經過14輪連續對話,研究人員讓GPT-4對3-13步的歷史內容,梳理出一個證明思路。

對此,GPT-4的總結中,突出顯示的兩個部分是研究后續證明的2個關鍵點。

第4點建立了一個基本的直覺,即一旦證明了極難CSP的存在,就可以使用「矛盾證明」來證明這些問題無法在多項式時間內求解。

而第6點恰好成為后續證明工作的通用模式。

從下一輪開始,研究人員便遵循這一初步方案,嚴格地進行證明。

然后,研究者按照草稿,在隨后的83輪對話中進行了嚴格的推理。

而這97輪對話,可以說構建出了一個極難的NP完全問題,其中一些實例在時間復雜度低于圖片(即窮舉搜索)的情況下是不可解的,也就是說,證明結論為P≠NP。

是的,如果你能嚴格證明存在一種特定類型的NP完全問題,當變量數趨于無窮大時,無法在多項式時間內求解這類問題,就可以認為,證明了P!=NP。

在Ke Xu和Guangyan Zhou的論文中,他們構建了CSP和SAT的極難示例,證明了這些示例在沒有窮舉法的情況下無法求解。

而GPT-4,也得出了一致的結論。

是的,如果我們能夠證明不存在一種算法能夠以低于圖片的時間復雜度解決某些SAT實例,那么當變量數量趨于無窮大時,它確實可以為某些無法在多項式時間內解決的NP完全問題的存在提供強有力的證據。

這項研究再次證明,GPT-4有充分的潛力與人類合作,共同探索極其復雜的專家級難題。

LLM不僅能掌握基本知識,還可以在廣泛的解空間中發現新的見解。這也預示著科學LLM的范式下,科學發現的無限前景。

蘇格拉底式推理

那么,GPT-4展現出如此強大,思維推理能力,背后的極致究竟是什么呢?

古希臘哲學家蘇格拉曾說過,「我不能教會別人任何事,我只能讓他們思考」。

這次,研究人員恰巧就從中汲取了靈感,提出一種通用問題的解決框架——蘇格拉底式推理(Socratic Reasoning)。

簡單講,蘇格拉底方法就是讓我們「一步一步思考」,提出一系列問題激發批判性思維。

這對于大模型來說,如果能夠進行批判性思考,就可以針對復雜問題提出高效的解決方案。

對此,研究團隊指出這一框架旨在推動LLM解決高度復雜任務,協調各種子問題,并引導其搭建高層次推理途徑。

「蘇格拉底式推理」是在人類與LLM之間的一系列對話回合中進行的,是與LLM一起解決復雜挑戰的遞歸機制。

如下圖所示,「蘇格拉底式推理」有5種強大的提示模式:演繹、轉換、分解、驗證、整合。

通過發掘新的見解和觀點,將復雜問題分解為子問題或步驟,并通過質疑回答進行自我完善。

「蘇格拉底式推理」中的問題解決模式(用圖片圖片分別表示(子)問題和結論

一般來說,在處理可以直接從推理中得出結論的問題時,會采用「演繹模式」(如 「讓我們一步步思考」)來指導LLM直接得出結論。

對于更復雜的問題,首先要求LLM將問題轉化為新問題,或分解為若干子問題。然后,通過遞歸方法,直到找到「原子問題」。

P vs. NP問題對話轉換示例

在生成新問題或得出新結論時,通過「驗證模式」,利用LLM自我批判能力進行驗證和完善。

最后,「整合模式」要求 LLM 基于子問題的結果合成結論。

整個流程,研究人員鼓勵LLM通過一系列對話,遞歸地繼續上述過程,直至解決目標問題。

這篇論文,研究人員揭示了大模型能夠在解決科學問題中大有可為,能夠在得出復雜問題結論中細化攻堅的策略。

通過97論文對話引導,GPT-4展現出超人能力,完成了千禧數學難題全推理過程。

圖片

作者介紹

Qingxiu Dong,北京大學計算語言學研究所博士生。

圖片

Li Dong,微軟亞洲研究院首席研究員。

此前,他曾于2010年至2015年,在北航軟件開發環境國家重點實驗室跟隨Ke Xu從事研究工作。

圖片

Ke Xu,北京航空航天大學計算機科學教授。

此前,他在北京航空航天大學獲得了學士、碩士和博士學位。研究興趣包括算法與復雜性、數據挖掘和網絡。

圖片

責任編輯:張燕妮 來源: 新智元
相關推薦

2023-09-14 12:34:20

AI模型

2023-10-10 13:51:46

GPT-4GitHubAI

2023-06-19 09:57:23

GPT-4技術

2023-05-22 13:31:06

GPT-4語言能力智商

2024-10-28 16:20:00

2023-06-25 14:59:07

2023-04-10 11:45:26

GPT-4AI

2025-09-04 09:04:13

2023-10-10 12:30:51

AI模型

2025-07-31 01:15:00

ChatGPTAI教育

2025-12-15 08:41:00

陶哲軒AI數學

2024-07-08 13:08:04

2023-12-06 13:44:00

模型訓練

2025-08-13 09:10:40

2025-10-08 09:49:06

2024-12-17 12:53:45

AI自我進化谷歌

2025-08-05 14:54:39

AI模型陶哲軒

2024-07-03 17:13:32

2024-12-09 09:35:00

AI數據訓練

2025-08-11 09:27:00

點贊
收藏

51CTO技術棧公眾號

九九九久久久精品| 久久97视频| 久久精品夜色噜噜亚洲a∨| 国外成人在线视频| 毛片网站在线免费观看| 精品一区二区在线免费观看| 18久久久久久| av成人在线观看| 亚洲精品国产视频| 国产xxxx振车| 久久精品国产精品青草| 精品国产区在线| 不卡在线一区| 国产成人一区二区| 精品国产三区在线| 少妇精69xxtheporn| 黄色免费网站在线| 日韩免费电影网站| 国产一级精品aaaaa看| 黄色综合网站| 久久精品国产第一区二区三区最新章节| 亚洲精品无吗| 欧美在线激情网| 欧美顶级大胆免费视频| 成人在线精品视频| 天天影视综合| 99精彩视频在线观看免费| 精品一区二区三| 国产精品草莓在线免费观看| 日本午夜精品久久久| 国产精品自产拍在线观看| 久久社区一区| 日本不卡一区| 国产精品资源站在线| 干日本少妇首页| 中文字幕免费在线观看视频一区| 日本久久久久久久久久久久| 一区二区三区91| 美女无遮挡网站| 色哟哟在线观看一区二区三区| 国产在线中文字幕| 久久福利网址导航| 在线国产一级| 欧美成人国产一区二区| 成人国产综合| 91久久精品美女高潮| 国产精品地址| 男人天堂a在线| 一本一本久久a久久精品综合麻豆 一本一道波多野结衣一区二区 | 深夜福利视频一区二区| 欧美多人爱爱视频网站| 一区二区国产精品| 免费成人在线视频网站| 亚洲电影中文字幕在线观看| 成人影院www在线观看| 欧美成人免费视频| 亚洲黄色影院| 在线看片你懂得| 北条麻妃久久精品| 午夜日韩电影| 日本wwwwww| 亚洲天堂av在线免费| 欧美hd在线| 亚州福利视频| 九九热视频这里只有精品| 久久99最新地址| 青青草免费在线视频| 欧洲亚洲在线视频| 久久亚洲影视婷婷| 日本精品在线一区| 亚洲高清视频在线观看| 欧美一三区三区四区免费在线看 | 18免费在线视频| 国产美女久久精品香蕉69| 国产欧美一区二区三区鸳鸯浴| 天堂√中文最新版在线| 精品视频一区在线| 欧美欧美午夜aⅴ在线观看| 五月天激情综合网| 日av中文字幕| 欧美国产在线电影| 国产精品视频观看| 亚洲人和日本人hd| 国产videos| 日本欧美中文字幕| 亚洲国产婷婷综合在线精品| 欧美**字幕| 成人高清网站| 欧美日韩综合精品| 国产一区二区精品丝袜| 91免费看视频| 久久九九热re6这里有精品| xxxx18hd亚洲hd捆绑| 美女性感视频久久久| 岛国av一区二区三区| 日韩va亚洲va欧美va久久| 激情亚洲影院在线观看| 97在线播放视频| 国产精品xxx视频| 欧美亚洲国产一卡| 精品一区二区三区在线观看| 欧美a级大片在线| 男人免费av| 在线精品日韩| 欧美激情视频网| 欧美一区二区三区系列电影| 日韩亚洲欧美精品| 亚洲最大中文字幕| 中文字幕日韩一区| 日韩在线观看一区二区| 黄色在线看片| 人人澡人人爽人人揉| 日韩.欧美.亚洲| 日韩av大片在线| 国产亚洲一级高清| 精品国产乱码久久久久久虫虫漫画| 国产ts人妖一区二区| 欧美日韩91| 精品三级av在线导航| 阿v视频在线| 日韩电影网址| 成人动漫av| 久久国产乱子伦免费精品| 久久精品二区| 91成人免费看| 热99在线视频| 久热精品在线视频| 亚洲第五色综合网| 色噜噜夜夜夜综合网| 中文字幕免费观看一区| 久久精品999| 日本vs亚洲vs韩国一区三区二区 | 日韩精品福利一区二区三区| 97在线视频免费观看完整版| 色老板视频在线观看| 超碰在线97免费| 精品少妇一区二区三区在线| 日韩激情久久| 亚洲精品一品区二品区三品区 | 2020最新国产精品| 成人在线观看免费播放| 岛国av在线网站| h1515四虎成人| 成人国产精品入口免费视频| 日本三级一区| 国产激情欧美| 亚洲超碰在线观看| 国产精品视屏| 97精品国产福利一区二区三区| 成人精品视频| 欧美日韩爆操| 蜜臀av一区二区| av在线播放不卡| 最新国产成人在线观看| 亚洲第一狼人社区| 91福利在线导航| 日韩精品一区二区三区三区免费| 欧美日韩电影一区| 亚洲精品ady| 国内精品在线一区| 久久免费视频在线| 国产亚洲自拍一区| 最新不卡av在线| 久久久国产91| 国产又粗又大又爽的视频| 午夜在线视频播放| 在线观看一区视频| 在线免费观看视频一区| 国产美女精品在线观看| 99精品老司机免费视频| 99热免费精品| 日韩精品一区二区三区视频播放 | 一区二区成人在线| 国产成人精品av在线| a天堂中文在线官网| 国产精品成人a在线观看| 欧美主播一区二区三区| 国产69精品久久久| 人人干人人干人人| 国产欧美日韩一区二区三区四区| 中文字幕不卡在线观看| 97国产精品久久| 初尝黑人巨炮波多野结衣电影| 亚洲日本va中文字幕| 国产精品美女一区二区三区| 国产成人精品电影| 欧洲免费在线视频| 丝袜国产日韩另类美女| 91麻豆精品国产自产在线| 久久99九九| 欧美freesex| 中文字幕在线一区免费| 国产日本欧美一区二区三区在线 | 亚洲精品一区二区在线| 无码粉嫩虎白一线天在线观看| 国产在线导航| 精品国产99| 欧美日韩精品一区二区在线播放| 亚洲国产一区二区三区在线播| 综合另类专区|